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近年 来 金融 时 间 序 列 这 个 研究 领域 已 经 引起 了 人 们 广泛 的 关注 , 尤其 是 当 2003 
年 Robert Engle 教授 和 Clive Granger 教授 获得 诺 贝 尔 经 济 学 奖 之 后 . 与 此 同时 ， 
金融 计量 经 济 学 领域 也 有 了 新 的 发 展 , 尤其 是 在 高 频 金融 、 随 机 波动 率 以 及 可 用 性 
软件 方面 . 于 是 我 们 需要 为 高 年 级 本 科 生 、 研 究 生 、 技 术 人 员 以 及 研究 人 员 提 供 一 
套 更 为 完善 易 懂 的 素材 . 在 准备 第 2 版 时 我 们 的 主要 目的 是 在 新 的 发 展 和 实证 分 
析 方 面 进行 更 新 , 并 且 扩 大 这 本 书 的 核心 素材 , 将 异 方差 和 序列 相关 存在 时 的 相合 
协 方差 估计 、 波动 率 建 模 的 备 选 方法 、 金融 因子 模型 、 状 态 空 间 模 型 、 卡 尔 曼 滤波 
以 及 随机 扩散 模型 的 估计 也 包含 了 进来 . 

因此 本 书 扩展 到 了 12 章 , 而 且 本 书 另 一 个 重要 的 修改 是 包含 了 S-Plus 命令 和 
说 明 , 木版 同时 更 新 了 许多 实证 例子 和 练习 , 使 其 包含 了 最 近 的 数据 . 

新 增 的 两 章 是 第 9 章 主 成 分 分 析 及 因子 模型 , 与 第 11 章 状 态 空间 模型 和 卡尔 
， 曼 滤波 . 本 书 所 讨论 的 因子 模型 包含 了 宏观 经 济 因 子 模型 ,基本 面 的 因子 模型 和 统 
计 因 子 模型 . 对 于 分 析 像 组 合 收益 这 样 的 高 维 金融 数据 , 这 些 模型 是 简单 而 有 力 的 
TA. 为 说 明 其 应 用 , 本 书 给 出 了 实证 的 例子 ， 新 增 的 状态 空间 模型 和 卡尔 曼 滤 波 
是 为 了 阐明 其 在 金融 中 的 应 用 以 及 容易 计算 的 特点 . 第 12 章 中 , 在 一 般 马 尔 科 夫 
链 蒙 特 卡 罗 (MCMC) 框架 下 , 状态 空间 模型 和 卡尔 曼 滤波 可 用 来 估计 随机 波动 率 
异型 . 该 估计 还 用 到 了 向 前 滤波 和 向 后 抽样 的 方法 以 增加 计算 效率 . 

下 面 我 们 对 第 2 版 新 增 的 内 容 给 出 一 个 简要 概括 . 

(1) 更 新 了 全 书 所 用 的 数据 . 

(2) 给 出 了 S-Plus 命令 和 演示 . 

(3) 第 2 章 考虑 了 单位 根 检验 以 及 存在 异 方差 和 序列 相关 时 协 方差 矩阵 的 相 
合 估计 方法 . 

(4) 第 3 章 描述 了 波动 率 建 模 的 备 选 方法 , 包括 应 用 高 频 交 易 数 据 以 及 一 项 资 
产 的 日 最 高 价 和 日 最 低 价 . 

(5) 第 4 章 给 出 了 非 线性 模型 和 方法 的 更 多 应 用 ， 

(6) 第 7 章 引 入 了 更 多 风险 值 的 概念 和 应 用 . 

(7) 第 8 章 讨论 了 协 整 向 量 自 回归 模型 . 

(8) 第 10 章 涵盖 了 各 种 多 元 波动 率 模型 . 

(9) 第 12 章 中 增加 了 有 效 的 MCMC 方法 来 估计 随机 波动 率 模型 . 

本 次 修改 主要 得 益 于 同事 、 朋友 以 及 许多 第 1 版 读者 们 富有 建设 性 的 意见 . 我 
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对 他 们 表示 由 衷 的 感谢 . 特别 感谢 J. C. Artigas, Spencer Graves, Chung-Ming Kuan, 
Henry Lin, Daniel Pena, Jeff Russell, Michael Steele, George Tiao, Mark Wohar, Eric 
Zivot 以 及 我 的 MBA 班 上 学 习 金 融 时 间 序 列 的 学 生 们 , 感谢 他 们 的 建议 和 讨论 , 同 
时 要 特别 感谢 John Wiley 的 生产 编辑 Rosalyn Farkas. 在 此 我 也 要 感谢 我 的 妻子 
和 孩子, 他 们 给 了 我 无 条 件 的 支持 和 鼓励 , 值得 一 提 的 是 , 我 在 金融 计量 经 济 方面 
的 部 分 研究 受到 美国 国家 自然 科学 基金 、( 中 国 台 湾 ) “中 央 研究 院 ” 经 济 研究 所 高 
频 金融 项 目 以 及 芝加哥 大 学 商学 院 的 支持 . 
最 后 , 该 书 的 网 址 是 : 


gsbwww.uchicago.edu/fac/ruey.tsay/teaching/fts2. 


蔡 瑞 胸 (Ruey S. Tsay) 
芝加哥 大 学 


第 1 版 前 言 


本 书 来 源 于 自 1999 年 以 来 我 在 芝加哥 大 学 商学 院 所 教 的 MBA( 工 商 管理 硕 
L) 金融 时 间 序 列 分 析 课 程 . 它 也 包含 了 过 去 几 年 我 开设 的 时 间 序 列 分 析 博 士 生 课 
程 的 素材 . 这 是 一 本 引 论 性 质 的 书 , 上 骨 在 对 金融 计量 经 济 模型 及 其 在 金融 时 间 序 列 
数据 的 建 模 和 预测 中 的 应 用 进行 综合 与 系统 的 阐述 . 本 书 的 日 的 是 使 读者 了 解 金 
融 数 据 的 基本 特征 、 理 解 金融 计量 经 济 模型 的 应 用 并 获得 分 析 金 融 时 间 序 列 的 经 
验 . 

本 书 可 作为 金融 专业 MBA 学 生 的 时 间 序 列 分 析 教 材 , 也 适用 于 商学 、 经 济 学 、 
数学 和 统计 学 专业 对 金融 计量 经 济 学 感 兴趣 的 高 年 级 本 科 生 和 研究 生 . 同时 , 它 也 
可 作为 商业 、 金融 、 保险 领域 中 要 进行 风险 值 (VaR, Value at Risk) 计算 、 波 动 率 
(volatility) 建 模 和 对 具有 序列 相关 性 的 数据 进行 分 析 等 工作 的 研究 人 员 和 业内 人 
士 的 参考 书 ， 

对 计量 经 济 学 和 统计 学 文献 中 的 金融 计量 方法 的 最 新 进展 进行 概述 是 本 书 的 
突出 特点 . 这 些 进展 包括 当前 的 研究 热点 , 如 风险 值 、 高 频数 据 分 析 和 马尔 可 夫 链 
蒙特 卡 罗 (MCMC) 方法 等 . 特别 地 , 本 书包 含 了 一 些 在 学 术 杂 志 上 尚未 发 表 的 最 
新 研究 成 果 , 可 参阅 第 6 章 中 关于 使 用 封闭 形式 的 跳跃 扩散 方程 来 进行 衍生 产品 
的 定价 , 第 7 章 中 基于 非 齐 次 二 维 泊 松 (Poisson) 过 程 的 极 值 理论 计算 风险 值 , 以 
及 第 9 章 中 带 时 变相 关系 数 的 多 元 波动 率 模型 等 . 本 书 之 所 以 介绍 MCMC 方法 
是 因为 这 类 方法 在 金融 计量 经 济 学 中 是 强 有 力 的 工具 , 并 且 对 其 有 大 量 的 应 用 . 

强调 实例 和 数据 分 析 是 本 书 的 另 一 个 突出 特点 .全书 采 用 实际 金融 数据 来 说 
明 所 讨论 模型 和 方法 的 应 用 . 我 们 的 分 析 用 到 了 多 种 计算 机 软件 : 线性 时 间 序 列 
的 建 模 用 SCA(Scientific Computing Associates, 科学 计算 助手 ); 估计 波动 率 模型 用 
RA'TS(Regression Analysis for Time Series, 时 间 序 列 的 回归 分 析 ); 实现 神经 网 络 和 
绘制 PS 格式 的 图 形 用 S-Plus. 运行 这 些 软件 包 所 需 的 一 些 命令 将 在 相应 各 章 后 
的 附录 中 给 出 . 特别 地 , 用 来 估计 多 元 波动 率 模型 的 复杂 的 RATS 程序 在 第 9 章 的 
附录 A 中 给 出 . 其 中 有 些 我 和 其 他 人 编 的 Fortran 程序 可 用 来 对 简单 的 期 权 定 价 、 
估计 极 值 模型 、 计 算 风 险 值 和 进行 贝 叶 斯 (Bayesian) 分 析 . 一 些 数 据 和 程序 可 以 在 
万 维 网 上 获得 , 网 址 为 : nttp://www.gsb.uchicago.edu/fac/ruey.tsay/teaching 
/fts 

本 书 第 1 章 描 述 了 金融 时 间 序 列 数据 的 一 些 基 本 特征 ,其 他 各 章 分 为 三 个 部 
分 : 第 一 部 分 由 第 2 章 至 第 7 章 组 成 , 讨论 一 维 金融 时 间 序 列 的 分 析 及 应 用 ; 第 二 


部 分 包括 第 8 章 和 第 9 章 , 是 关于 多 项 资产 收益 率 序列 的 ; 最 后 一 部 分 是 第 10 章 ， 
介绍 用 MCMC 方法 进行 金融 中 的 贝 叶 斯 推断 . 

完全 读 懂 本 书 需要 具备 基本 统计 学 的 概念 和 知识 . 在 每 章 中 , 当 一 个 必要 的 统 
计 学 概念 第 一 次 出 现时 , 我 都 给 出 了 一 个 简短 的 回顾 . 即使 如 此 , 统计 学 或 商业 统 
计 学 的 必 备 知识 , 包括 概率 分 布 、 线 性 回归 分 析 , 还 是 竭力 推荐 的 . 金融 知识 对 理 
解 书 中 所 讨论 的 应 用 是 很 有 帮助 的 . 然而 , 对 有 具有 很 好 的 计量 经 济 学 和 统计 学 背景 
的 读者 来 说 , 也 会 在 本 书 中 发 现 多 方面 有 趣 的 主题 和 带 挑战 性 的 问题 . 

作为 MBA 的 课程 , 第 2 章 和 第 3 章 是 核心 内 容 , 另外 还 可 加 入 一 些 非 线 性 方 
法 的 内 容 (如 第 4 章 的 神经 网 络 及 第 5~7 章 和 第 10 章 中 讨论 的 应 用 ). 对 贝 叶 斯 
推断 感 兴趣 的 读者 可 以 从 第 10 章 的 前 5 节 开 始 阅 读 . 

金融 时 间 序 列 分 析 的 研究 发 展 迅速 , 新 成 果 不 断 出 现 . 虽然 我 已 经 力图 履 盖 尽 
可 能 广 的 内 容 , 但 仍 有 许多 主题 没有 涉及 或 只 是 一 带 而 过 ， 

我 真诚 地 感谢 我 的 老师 和 亲密 的 朋友 George C. Tiao, 是 他 在 这 些 年 中 给 了 
我 指导 和 鼓励 ， 让 我 有 了 对 统计 应 用 的 坚定 信念 . 感谢 Steve Quigley, Heather 
Haselkorn, Leslie Galen, Danielle LaCourciere 和 Amy Hendrickson, 没有 他 们 的 帮 
助 这 本 书 是 不 可 能 出 版 的 . 感谢 Richard Smith 送 给 我 极 值 理 论 的 估计 程序 . 感谢 
Bonnie K. Ray 对 本 书 的 几 个 章节 都 给 出 了 非常 有 益 的 建议 . 感谢 Steve Kou 送 给 
我 他 的 关于 跳跃 扩散 模型 论文 的 预 印 本 ， 感 谢 Robert E. McCulloch 许多 年 来 在 
MCMC 方法 上 的 合作 . 感谢 选修 我 的 金融 时 间 序 列 分 析 课 程 的 许多 学 生 的 反馈 和 
BLA. 感谢 Jeffrey Russell 和 Michael Zhang 关于 高 频 金 融 数据 的 深入 讨论 . 同时 ， 
也 感谢 世 加 哥 大 学 商学 院 和 美国 国家 科学 基金 的 支持 . 最 后 , 对 我 的 妻子 Teresa 的 
一 贯 支持 、 鼓 励 和 理解 , 对 Julie, Richard 和 Vicki 给 我 带 来 的 快乐 和 灵感 以 及 对 
我 的 父母 亲 给 我 的 关爱 , 表示 我 最 更 心 的 谢意 . 


蔡 瑞 胸 (Ruey S. Tsay) 
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第 1 章 金融 时 间 序 列 及 其 特征 


金融 时 间 序 列 分 析 考 虚 的 是 资产 价值 随时 间 演 变 的 理论 与 实践 . 它 是 一 个 带 有 
高 度 经 验 性 的 学 科 , 但 也 像 其 他 科学 领域 一 样 , 理论 是 形成 分 析 推 断 的 基础 . 然而 ， 
金融 时 间 序 列 分 析 有 一 个 区 别 于 其 他 时 间 序 列 分 析 的 主要 特点 : 金融 理论 及 其 经 
验 的 时 间 序 列 都 包含 不 确定 因素 . 例如 , 资产 波动 率 有 各 种 不 同 的 定义 , 对 一 个 股 
票 收益 率 序列 , 波动 率 是 不 能 直接 观察 到 的 . 正 因 为 带 有 不 确定 性 , 统计 的 理论 和 
方法 在 金融 时 间 序 列 分 析 中 起 重要 作用 . 

本 书 的 目的 是 提供 一 些 金融 时 间 序 列 的 知识 , 介绍 一 些 对 分 析 金 融 时 间 序 列 有 
用 的 统计 工具 ， 从 而 使 读者 获得 各 种 经 济 计量 方法 在 金融 中 应 用 的 经 验 . 第 1 章 
引入 资产 收益 率 的 基本 概念 , 并 简要 介绍 本 书 所 讨论 的 一 些 过 程 ， 第 2 章 回 顾 了 
一 些 线性 时 间 序 列 分 析 中 的 基本 概念 , 如 平稳 性 、 自 相关 函数 , 引入 了 一 些 简单 的 
线性 模型 来 处 理 序列 的 序列 相关 性 , 并 讨论 了 带 时 间 序 列 误差 、 季 节 性 、 单 位 根 非 
平稳 性 和 长 记忆 过 程 的 回归 模型 . 当 存 在 条 件 异 方差 性 和 序列 相关 时 , 该 章 给 出 
了 协 方差 阵 相 合 估计 的 方法 . 第 3 章 着 重 讨论 了 条 件 异 方差 性 (资产 收益 率 的 条 
件 方差 ) 的 建 模 , 讨论 了 新 近 发 展 起 来 的 用 来 描述 资产 收益 率 的 波动 率 随时 间 演 变 
的 各 种 经 济 计量 模型 . 该 章 还 讨论 了 波动 率 建 模 的 其 他 方法 , 包括 使 用 高 频 交 易 数 
据 和 一 项 资产 的 日 最 高 价格 和 日 最 低 价格 进行 建 模 . 第 4 章 讨论 了 金融 时 间 序 列 
中 的 非 线 性 性 , 引入 了 能 区 别 非 线性 序列 与 线性 序列 的 检验 统计 量 , 并 讨论 了 几 个 
非 线性 模型 . 该 章 还 介绍 了 非 参数 估计 方法 和 神经 网 络 , 并 且 展 示 了 非 线性 模型 在 
金融 中 的 各 种 应 用 . 第 5 章 考 虑 的 是 高 频 金 融 数据 的 分 析 及 其 在 市 场 微 观 结构 中 
的 应 用 , 阐明 了 不 同步 (或 不 同时 ) 的 交易 和 买卖 价格 间 的 跳跃 可 能 带 来 股票 收益 
的 序列 相关 性 .该 章 还 研究 了 不 同 交 易 之 间 持 续 时 间 的 动态 规律 和 一 些 分 析 交 易 
数据 的 计量 经 济 模型 . 第 6 章 引 入 了 连续 时 间 扩 散 模 型 和 伊 滕 (Ito) 引 理 , 导出 了 
Black-Scholes 期 权 定价 公式 , 并 应 用 一 个 简单 的 跳跃 扩散 模型 来 刻画 期 权 市 场 常 见 
的 一 些 特征 . 第 7 章 讨论 了 极 值 理论 、 厚 尾 分 布 及 其 在 金融 风险 管理 中 的 应 用 . 该 
章 还 特别 讨论 了 计算 金融 头寸 风险 值 (VaR) 的 各 种 方法 . 第 8 章 着 重 讨论 多 元 时 
间 序 列 分 析 和 简单 的 多 元 模型 , 重点 在 于 分 析 时 间 序 列 之 间 的 交叉 延迟 关系 . 该 章 
还 介绍 了 协 整 、 一 些 协 整 检 验 以 及 门限 协 整 , 并 用 协 整 的 概念 来 研究 金融 市 场 中 的 
套利 机 会 . 第 9 章 讨论 本 简化 多 元 时 间 序 列 动态 结构 的 方法 和 降低 维 数 的 方法 , 并 
介绍 和 演示 了 3 种 因子 模型 来 分 析 多 个 资产 的 收益 率 , 第 10 章 介绍 了 多 元 波动 率 
模型 , 其 中 包括 带 时 变相 关系 数 的 模型 , 同时 还 讨论 了 怎样 对 一 个 条 件 协 方差 阵 进 
行 重 新 参数 化 , 使 之 满足 正定 性 的 限制 , 并 降低 波动 率 建 模 的 复杂 性 . 第 11 章 介绍 


2 第 1 章 金融 时 间 序 列 及 其 特征 


了 状态 空间 模型 和 卡尔 最 滤 波 , 还 讨论 了 状态 空间 模型 和 本 书 中 所 讨论 的 其 他 计量 
经 济 模型 之 间 的 关系 . 该 章 还 给 出 了 在 金融 方面 应 用 的 几 个 例子 . 最 后 , 第 12 章 介 
绍 了 统计 文献 中 一 些 新 近 发 展 起 来 的 马尔 可 夫 链 蒙特 卡 罗 方 法 , 并 把 这 些 方 法 应 用 
于 各 种 金融 研究 的 问题 , 如 随机 波动 率 模型 和 马尔 可 夫 转 换 模型 的 估计 . 

本 书 着 重 强 调 应 用 和 实证 分 析 . 每 章 都 有 实际 例子 , 很 多 时 候 经 济 计量 模型 的 
发 展 是 由 金融 时 间 序 列 的 实证 特征 来 推动 的 . 必要 时 , 本 书 还 提供 了 用 来 分 析 数 据 
的 计算 机 程序 和 命令 . 在 某 些 案例 中 , 程序 已 在 附录 中 给 出 . 书 中 各 章 的 练习 题 也 
要 用 到 很 多 实际 数据 . 


1.1 资产 收益 率 


多 数 金融 研究 针对 的 是 资产 收益 率 而 不 是 资产 价格 . Campbell Lo 和 MacKin- 
lay (1997) 给 出 了 使 用 收益 率 的 两 个 主要 理由 : 第 一 , 对 普通 的 投资 者 来 说 , 资产 收 
益 率 完全 体现 了 该 资产 的 投资 机 会 , 且 与 其 投资 规模 无 关 ; 第 二 , 收益 率 序列 比价 
格 序列 更 容易 处 理 , 因为 前 者 有 更 好 的 统计 性 质 . 然而 , 资产 收益 率 有 多 种 定义 . 

设 是 资产 在 t+ 时 刻 的 价格 . 下 面 给 出 全 书 中 要 用 到 的 一 些 收益 率 的 定义 . 暂 
时 假定 资产 不 支付 分 红 . 

单 期 简单 收益 率 

若 从 第 t 一 1 天 到 第 tO (一 个 周期 ) 持 有 某 种 资产 , 则 简单 毛 收益 率 为 


P, 
L4 RH 5 或 P= Pri(1+ Rr). (1.1) 


对 应 的 单 期 简单 净 收 益 率 或 称 简单 收益 率 为 


(1.2) 


3 38 Nj Pk dà 


若 从 第 上 一 大 天 到 第 上 天 这 大 个 周期 内 持 有 某 种 资产 , W k- 期 简单 毛 收益 率 


^ & B. 8 
la RI ee 97m. ul E uu me. cua bici 
d Ber Fy Fea Re 
=(1+ R4) (L2- R41): -- (197 Re kai) 
k—1 


这 样 , k- 期 简单 毛 收 益 率 就 是 其 所 包含 的 这 大 个 单 期 简单 毛 收 益 率 的 乘积 , 称 为 复 
合 收 益 率 . k- 期 简单 净 收 益 率 是 R, [k] = (P, — Py x) /Pk. 
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在 实际 中 , 确切 的 时 间 区 间 对 讨论 和 比较 收益 率 是 非常 重要 的 (例如 是 月 收益 
率 还 是 年 收益 率 ). 若 时 间 区 间 没 有 给 出 , 那么 就 隐 含 地 假定 时 间 区 间 为 1 年 . 如 果 
持 有 资产 的 期 限 为 上 年 , 则 (平均 的 ) 年 化 收益 率 定义 为 


k—1 


l/k 
年 化 的 {Ri [k]) = i (1+ = i 


j=0 


这 是 由 它 所 包含 的 这 大 个 单 期 简单 毛 收 益 率 的 几何 平均 得 到 的 , 可 以 用 下 式 计算 ; 
1 大 一 1 
年 化 的 {Ri [k]} = exp T > in(1+ Ros)! - 1, 
j=0 


其 中 cxp(z) 表示 指数 函数 , In(z) BIER x 的 自然 对 数 . 因为 计算 算术 平均 值 比 计 
算 几 何平 均值 容易 , 并 且 单 期 收益 率 般 很 小 , 我 们 可 以 用 一 阶 泰勒 (Taylor) 展开 
来 近似 年 度 化 的 收益 率 , 得 到 


大 一 1 
年 化 的 {R 内 } < 过》 Ri (1.3) 
j=0 


然而 , 在 有 些 应 用 中 , (1.3) 式 近似 的 精度 可 能 不 够 . 

连续 复合 

在 引进 连续 复合 收益 率 之 前 , 我 们 讨论 一 下 复合 的 效果 . 假定 银行 存款 的 年 利 
率 为 10%, 最 初 存款 为 1 美元 . 如 果 该 银行 每 年 支付 一 次 利息 , 那么 1 年 之 后 存款 
的 净值 变 为 1 美元 x(1--0.1) = 1.1 美元 . 如 果 该 银行 半年 付 息 一 次 , 6 个 月 的 利 
息 率 是 1096/2 = 5%, 第 1 年 之 后 净值 是 1 美元 x (1+ 0.1/2)? = 1.102 5 美元 . 一 般 
地 , 如 果 银 行 1 年 付 息 m 次 , 那么 每 次 支付 的 利息 率 为 10%/m, 1 年 后 存款 的 净值 
变 成 1 x (1 十 0.1/m)” 美元 . 表 1-1 给 出 了 年 利率 为 10% 时 一 些 常用 的 时 间 间 隔 
下 存款 1 美元 的 结果 . 


表 1-1 复合 效果 的 演示 (期 限 为 1 年 , 年 利率 为 10%) 


类 n 支付 次 数 每 期 的 利率 nd 
一 年 1 0.1 $1.100 00 
半年 2 0.05 $1.102 50 
季度 4 0.025 $1.103 NI 
H 12 0.008 3 81.104 71 
周 52 0.1/52 81.105 06 
X 365 0.1/365 81.105 16 


连续 地 o6 $1.105 17 
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特别 地 , 净值 趋 于 1.1052 美元 ~ exp (0.1) 美元 , 这 个 值 就 是 连续 复合 的 结果 . 于 是 ， 
我 们 可 以 清楚 地 看 到 复合 的 效果 . 
一 般 地 , 连续 复合 的 资产 净值 4 为 
A= Cexp(r x n), (1.4) 
其 中 > 是 年 利率 , C 是 初始 资本 , n 是 年 数 中 . 由 (1.4) 3X, 我 们 有 
C = Aexp(—r xn), (1.5) 
WIE n 年 后 价值 为 4 的 资产 的 现 值 , 这 里 我 们 假定 连续 复合 的 年 利率 为 x. 
连续 复合 收益 率 
资产 的 简单 毛 收益 率 的 自然 对 数 称 为 连续 复合 收益 率 或 对 数 收益 率 (log-return) 


P 
ri — In (1+ R) = n g^ =M= P 1, (1.6) 
= 


其 中 p = In Ph. 与 简单 净 收益 率 R 相 比 , 连续 复合 收益 率 r 有 一 些 优 点 . 首先 ， 
对 多 期 收益 率 , 我 们 有 
T, [k] = hi (1 +R [k]) = In [(1 + FR) (1 十 F1) et (1 E Ri—n41)| 
= In (1 + Ri) +In(1+ Ri_1) 十 …: 4- In (1 4- Ri-k+1) 
= Tp Tt oF) hea: 
这 样 , 连续 复合 多 期 收益 率 就 是 它 所 包含 的 连续 复合 单 期 收益 率 之 和 . 其 次 , 对 数 
收益 率 具 有 更 容易 处 理 的 统计 性 质 . 
资产 组 合 收 益 率 
若 一 个 资产 组 合 由 N 个 资产 组 成 , 则 该 资产 组 合 的 简单 净 收 益 率 是 它 所 包含 


的 各 个 资产 的 简单 净 收 益 率 的 加 权 平 均 , 其 中 每 个 资产 所 占 的 权重 是 该 资产 的 价值 
占 资产 组 合 总 价值 的 百分比 . Be p 是 一 个 资产 组 合 , 它 在 资产 i 上 的 权重 为 w, 那 


么 p 在 t 时 刻 的 简单 收益 率 Ru 一 $ wiRu, 其 中 Ra 是 资产 ;的 简单 收益 率 . 
然而 , 资产 组 合 的 连续 复合 收益 率 没有 上 述 方便 的 性 质 ， 如 果 简 单 收益 率 Ra 
的 绝对 值 都 很 小, 则 我 们 有 rpe = X worse, 其 中 rpe 是 该 组 合 在 + 时刻 的 连续 复合 
收益 率 . 这 种 近似 经 常 被 用 来 研究 资产 组 合 的 收益 率 . 
分 红 支 付 
如 果 一 个 资产 周期 性 地 支付 分 红 , 我 们 必须 修改 资产 收益 率 的 定义 . VE D, 是 
一 个 资产 在 第 + 一 1 天 和 第 t 天 之 间 的 分 红 , 已 是 该 资产 在 第 t 个 周期 末 的 价格 . 
DO WAAR. 一 一 译 者 注 
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这 样 , 分 红 并 没有 包含 在 P, 中 . 因此 , t 时 刻 简单 净 收益 率 和 连续 复合 收益 率 分 别 
变 为 


_ Per Dy 
Pr 


Re 
超额 收益 率 


一 个 资产 在 t 时 刻 的 超额 收益 率 是 该 资产 的 收益 率 与 某 个 参考 资产 的 收益 率 
之 差 . 这 个 参考 资产 通常 是 无 风险 的 , 如 美国 短期 国债 的 收益 率 . 简单 超额 收益 率 
和 对 数 超额 收益 率 分 别 定义 为 


Zi: = Ri— Ror, 2% = 4 — Tot, (1.7) 


其 中 Roe 和 ro, 2100 48 1:255 t 7 BO f8] PL tak 8 A ak E. 在 金融 文献 中 , 超 
额 收益 率 被 认为 是 某 个 套利 投资 组 合 的 盘 利 . 在 这 个 投资 组 合 中 , 对 某 资产 持 多 头 
头寸 而 对 参考 资产 持 空头 头寸 , 且 初 始 投 资 净值 为 0. 

RAO 头 金 融 头 寸 意 味 着 持 有 某 资产 .空头 头寸 则 指 卖 出 不 属于 自己 的 资 
f^. 这 须 通 过 从 已 购买 该 资产 的 投资 者 那里 借入 资产 来 完成 . 在 之 后 的 某 天 , KE 
者 有 义务 买 进 和 借入 完全 相同 数量 的 股份 偿还 给 借 出 者 ， 因 为 偿还 时 要 求 的 是 相 
等 数量 股份 , 而 不 是 相等 数量 的 美元 , 卖 空 者 会 由 于 该 资产 价格 的 下 跌 而 获 利 . 如 
果 在 空头 持续 期 间 该 资产 有 现金 分 红 , 则 支付 给 做 空 买卖 的 买 者 . 卖 空 者 也 必须 从 
自己 的 资源 里 配备 相应 的 现金 分 红 来 补偿 借 出 者 . 换 句 话说 , 卖 空 者 有 义务 支出 所 


—], re — ln(P) + Dj) — ln P, 4. 


借 资产 的 现金 分 红 给 借 出 者 . 口 
关系 小 结 
fr PC R, 与 连续 复合 收益 率 ny 的 关系 是 
ri —lnn(1--R,)), R,-—e'"-1. 


tuu R, r 是 百分比 , 则 
r, = 100In (1 + m) OR, = 100(e7*/190 _ 1, 
收益 率 的 时 间 累 加 使 得 
1+ Ry [k] = (1 + Re) (Y -- R4 3): (1 + Re 11), 
re [k] — rt Tia nk 
如 果 连 续 复合 年 利率 为 r, 则 资产 的 现 值 与 资产 的 未 来 价值 之 间 的 关系 为 


A=Cexp(rxn), C= Aexp(-rx n). 


例 1.1 车 某 项 资产 的 月 对 数 收 益 率 为 4.46%, 则 相应 的 月 简单 收益 率 为 100[exp 
(4.46/100)—1]—4.5696. 同样 , 若 某 项 资产 在 一 个 季度 内 的 月 对 数 收益 率 分 别 为 4.46%, 
—7.34%, 10.77%, 则 该 资产 的 季度 对 数 收益 率 为 (4.46—7.34410.77) %=7.89%. 
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1.2 Weal sth tthe 


要 研究 资产 收益 率 , 最 好 从 它们 的 分 布 性 质 开 始 . 目的 是 要 理解 不 同 资产 、 不 
同时 间 收 益 率 的 表现 .考虑 NN 个 资产 , 持 有 这 个 资产 了 个 时 间 周 期 , 如 = 
1,.… T. 对 每 个 资产 i, ri 表示 它 在 上 时 刻 的 对 数 收 益 率 . 所 要 研究 的 对 数 收益 率 
为 {ritii 一 1 ,Nit 一 1…,T }. 也 可 以 考虑 简单 收益 率 (Rud — 1 ,Nit= 
1,---, T) 和 对 数 超额 收益 率 { za;i = 1 Nit =l, T}. 

1.2.1 统计 分 布 及 其 矩 的 回顾 

我 们 简要 地 回顾 一 下 统计 分 布 的 一 些 基 本 性 质 和 随机 安 量 的 矩 . 设 R* 表示 
k- 维 欧 几 里 德 空间 , r c R* 表示 xr 是 R* 中 的 点 ; SRS PL X = 
(Xue Xr) MY —(Yi,---, Y). O P(X € AY € B) a X EFS A c R^ 
PAY 在 子 空间 B cR 中 的 概率 . 本 书 的 大 部 分 场合 , 都 假定 这 两 个 随机 向 量 
是 连续 的 . 

联合 分 布 

函数 


Fx y (Ty0)= P(X <2,.¥ <y;0), rcR?, ycR? 


是 参数 为 8 X 与 Y 的 联合 分 布 , 其 中 不 等 号 “<” 是 分 量 对 分 量 的 运算 , X 和 
Y 的 规律 由 Fx,y (x,y; 9) 刻画 . 如 果 X I Y 的 联合 概率 密度 函数 fay (m, y; 0) 
存在 , 则 NM 

Fx,y (2,9;8) = | | fi (10, z; 0) dzdw. 


这 时 , XA Y 是 连续 型 随机 问 量 . 
边际 分 布 
X 的 边际 分 布 是 
Fx (x; 8) i Fy y (2, 00, NE ,00; 0). 


这 样 , X 的 边际 分 布 可 通过 对 Y 求 积分 得 到 . 同 理 , Y 的 边际 分 布 也 可 类 似 得 到 
UR k-—1, X 是 一 个 一 元 随机 变量 , 其 分 布 函数 为 


Fx (x) = P(X <2;6), 


称 之 为 X HAST BERT (Cumulative Distribution Function, CDF). 一 个 随机 鸡 
量 的 CDF 是 非 降 的 (BURT zi € ag 有 Fx (x1) < Fx(r2)), HA Fx(—9o) = 0, 
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Fx (oc) = 1. 对 给 定 的 概率 p, 使 p< Fx (2p) 成 立 的 最 小 实数 n, 称 为 随机 变量 X 
的 p- 分 位 点 , 更 具体 地 ， 
By = inf {x |p < Fx (#)}. 
本 书 中 我 们 用 CDF 来 计算 检验 统计 量 的 p fü. 
条 件 分 布 
给 定 Y «y 的 条 件 下 Xx 的 条 件 分 布 为 
Pes (d. PLS um 


车 所 对 应 的 概率 密度 两 数 存在 , 则 给 定 Y = y 的 条 件 下 , X. 的 条 件 密度 为 


Say (x, y: 8) 


Tay (258) = fy (y: 0) 


(1.8) 
其 中 边际 密度 函数 f (us 0) 由 下 式 得 到 
fy(yi8)=| fou (cid. 
由 (1.8) 式 知 , 联合 分 布 、 LR 2 RA EAZ e RS 
fs (a8) = fiy (250) x fy (48). (19) 


上 述 等 式 关 系 在 时 间 序 列 分 析 中 经 常用 到 (如 在 进行 最 大 似 然 估 计时 ). 最 后 ， 
X 5 Y 是 相互 独立 的 随机 向 量 当 且 仅 当 fau (0:9) = 万 (zi9), 这 时 fry (©, y; 6) = 
fr (1;0) fy (y;0). 

随机 变量 的 给 

一 个 连续 型 随机 变量 X 的 1 阶 和 矩 定义 为 


m; =E (x^) = | a! f (x) dz, 
Hp UE" 表示 期 望 (expectation), f(x) 是 X 的 概率 密度 函数 . MERA X 的 
均值 (mean) 或 期 望 , 它 度量 的 是 分 布 的 中 心 位 置 , 记 为 uu. X 的 ! 阶 中 心 矩 定义 为 


m -E[x -2] =|" (E-n) faz. 
假定 上 式 中 积分 存在 . 二 阶 中 心 矩 可 度量 X 取 值 的 变化 程度 , 称 为 X 的 方差 (varia- 


nee), WA o2. 方差 的 正平 方 根 cx RA X 的 标准 差 . 一 个 正 态 分 布 由 它 的 前 两 阶 
RERE. 对 其 他 分 布 , 可 能 要 了 解 其 更 高 阶 甜 . 
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三 阶 中 心 矩 度量 X 关于 其 均值 的 对 称 性 , 而 四 阶 中 心 矩 度量 X 的 尾部 . 在 统 
计 学 中 , 标准 化 的 三 阶 矩 叫 偏 度 (skewness), 标准 化 的 四 阶 矩 叫 峰 度 (kurtosisj, 它们 
分 别 用 来 描述 随机 变量 的 对 称 程度 和 尾部 厚度 . 具体 地 , X 的 偏 度 和 峰 度 分 别 定义 


为 
S(z) =E [ege "ud i K(x)2E [Aer pe i 

T K (x) — 3 叫做 超额 峰 度 (excess kurtosis), 因为 正 态 分 布 的 峰 度 K (wr) = 3. iX 
FE. 一 个 正 态 随机 变量 的 超额 峰 度 为 0. 车 一 个 分 布 有 正 的 超额 峰 度 , 则 称 此 分 布 
有 具有 厚 尾 性 , 厚 尾 的 含义 是 指 该 分 布 在 其 支撑 (support) 的 尾部 有 比 正 态 分 布 更 多 
的 “质量 *. 在 实际 中 , 这 就 意味 着 来 白 于 这 样 一 个 分 布 的 随机 样本 会 有 更 多 的 极端 
值 , 故 称 这 样 的 分 布 为 尖峰 的 (leptokurtic). 另 一 方面 , 一 个 具有 负 的 超额 峰 度 的 分 
布 是 轻 尾 的 (例如 , 有 限 区 问 上 的 均匀 分 布 ), 这 样 的 分 布 称 为 低 峰 的 . 

在 应 用 中 , 我 们 可 以 用 相应 的 样本 偏 度 和 样本 峰 度 来 估计 偏 度 和 峰 度 . ns 
… ,ZT} Æ X K TARR, 样本 均值 为 


his inus 10) 

i-i 

样本 方差 为 " 

62 = Tu 2. (ri — jz)”, (1.11) 

样本 偏 度 为 
§(z) = corre ae — hs, (1.12) 

样本 峰 度 为 
K (x) = >, (me — fis)^. (1.13) 


在 正 态 分 布 的 假定 下 , S (x) 和 天 (z)-3 均 渐 近 地 服从 均值 为 零 、 而 方差 分 别 为 6/T 
和 24/T 的 正 态 分 布 [参见 Snedecor 和 Cochran (1980), 第 78 页 ]. 我 们 可 以 用 这 些 渐 
近 性 质 来 检验 资产 收益 率 是 否 具 有 正 态 性 . 给 定 一 个 资产 收益 率 序列 {r ,rz}， 
要 检验 其 偏 度 , 即 要 考虑 零 假设 Ho: Slr) = 0 WAHR Ha: S(r) 40. 由 (1.12) 
式 所 定义 的 样本 偏 度 的 t- 比 统计 量 为 
_ S(r) 
Ve6/T 
决策 规则 如 下 : 在 显著 性 水 平 a 下 , 车 [t > Zaye, 则 拒绝 零 假 设 , 其 中 Za 是 标 
准 正 态 分 布 的 100(a/2) 上 分 位 点 . 另外 一 个 方法 是 计算 检验 统计 量 t 的 p 值 , 当 


AM p 值 小 于 a 时 拒绝 Ho. 
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类 似 地 , 我 们 可 以 用 假设 检验 Ho: K(r) -3—0 5 Ha: K(r) — 3 40, 来 检验 
收益 率 序列 的 超额 峰 度 . 检验 统计 量 为 
| K(r)-3 
VE 
并 且 该 统计 量 渐 近 标准 正 态 分 布 . 决策 规则 为 当 且 仅 当 检验 统计 量 的 p 值 小 于 显 


著 性 水 平 a 时 拒绝 Ho. Jarque 和 Bera(1987) 结合 了 这 两 个 先 验 检验 , 并 利用 了 下 
述 统 计量 


S?(r) 4 (K(r) —3)? 

6/T mT ° 

其 中 , 该 统计 量 的 渐 近 分 布 是 自由 度 为 2 的 x? 分 布 . 如 果 JB 统计 量 的 p 值 小 于 
显著 性 水 平 a, 则 拒绝 正 态 性 的 Ho 假设 . 

例 1.2 ZEK 1-2 中 所 用 的 IBM 股票 的 日 简单 收益 率 . 作为 描述 性 统计 量 的 一 
部 分 , 收益 率 的 样本 偏 度 和 峰 度 可 以 用 各 种 统计 软件 包 很 容易 地 得 到 . 我 们 给 出 了 
实例 中 用 到 的 SCA 和 S-Plus 命令 , 其 中 ‘qd-ibmvwewsp6203.txt’ 是 数据 文件 名 . 需 
要 注意 的 是 , 在 SCA 中 峰 度 指 的 是 超额 峰 度 . 输出 结果 中 超额 峰 度 很 高 , 表明 TRM 
股票 的 日 简单 收益 率 具有 厚 尾 性 . 为 了 检验 收益 率 分 布 的 对 称 性 , 我 们 用 检验 统计 
量 


ZB-— 


~ 0.024 . 
该 检验 统计 量 的 p 值 大 约 为 0.001, 表明 在 5 名 的 显著 性 水 平 下 , IBM 股票 的 日 简单 
收益 率 显著 地 右 偏 . 


表 1-2 几 种 股指 和 股票 日 或 月 简单 收益 率 和 对 数 收益 率 的 描述 性 统计 量 n 


证 券 起 始 口 期 AR ”均值 ”标准 差 mE 超额 峰 度 最 小 值 最 大 值 
日 简单 收益 率 (%) 
SP 62/7/3 10446 0.033 0.945 —0.95 25.76 一 20.47 9.10 
VW 62/7/3 10446 0.045 0.794 —0.76 18.32 —17.14 8.66 
EW 62/7/3 10446 0.085 0.726 —0.89 13.42 一 10.39 6.95 
IBM 62/7/3 10446 0.052 1.648 —U.UN 10.21 一 22.96 13.16 
Intel 72/ 12/15 7825 0.131 2.998 —0.16 5.85 29.57 26.38 
3M 62/7/3 10446 0.054 1.465 —0.28 12.87 一 25.98 11.54 
Microsoft 86/3/14 4493 — 0.157 2.500  —0.25 8.75 —30.12 19.57 
Citi-Group — 86/10/30 4333 — 0.110 2.289 — —0.10 6.79 —21.74 20.76 
日 对 数 收益 率 (96) 
SP 62/7/3 10446 0.020 0.951 1.41 36.91 2.90 8.71 
VW 62/7/3 10446 0.041 0.895 —1.06 23.91 一 18.80 8.31 
EW 62/7/3 10446 0.082 0.728 — —1:29 14.70 —10.97 6.72 
IBM 62/7/3 10446 0.039 1.649  —0.25 12.60 —26.09 . 12.37 
Intel 72/12/15 (828 0.086 3.013 —0.54 7.54 —35.06 23.41 
3M 62/7 /3 10446 0.044 1.460 0.60 20.06 30.08 10.92 


Microsoft. 86/3/14 4493 — 0.126 2.518 — —0.73 13.23 —35.83 17.87 
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( 续 ) 
证 券 超 始 日 期 ”样本 量 ”均值 标准 差 a 超额 峰 度 最 小 值 GA 
Citi-Group 86/10/30 4333 0.084 2.289 一 0.21 7.47 —24.51 18.86 
月 简单 收益 率 (96) 
SP 62/1 936 0.64 5.36 —0.35 9.26 一 29.94 42.22 
VW 26/1 936 0.95 5.49  —0.18 7.52 —28.98 38.27 
EW 26/1 936 1.31 7.49 —1.54 14.64 —31.18 65.51 
IBM 26/1 936 1.42 TAL 一 0.27 2.15 —20.19 35.38 
Intel 73/1 372 2,03 13.42 —0.26 2.43 —44.87 62.50 
3M 46/2 695 1.37 6.53 . —0.24 0.96 一 27.83 25.80 
Microsoft, 86/4 218  À 23.37 11.95 — —0.53 1.40 —34.35 51.55 
Citi-Group 86/11 206 2.20 9.52 —0.18 0.87 —34.48 26.08 
月 对 数 收益 率 (96) 
SP 26/1 936 — U.48 5.602 — —0.50 7.77 —35.58 35.22 
VW 26/1 936 | 0.79 5.48 —0.54 0.72 —34.22 32.41 
EW 26/1 936 1.04 7.21 0,29 8.40 —37.37 50.38 
IBM 26/1 936 1.16 7.02 一 0.15 2.04 —30.37 30.29 
Intel 73/1 372 1.80 13.97 . —0.60 2.90 —59.54 48.55 
3M 46/2 695 1.16 6.43 —0.06 1.25 —32.61 22.95 
Microsoft 86/4 213 2.660 11.48 —0.01 1.19 —42.09 41.58 


Citi-Group 86/11 206 1.73 9.55 —0.65 2.08 —42.28 23.18 


a 收益 率 是 百分比 , 取样 期 截止 到 2003 年 12 月 31 H. 统计 量 分 别 由 (1.10) 一 (1.13) 式 定义 . VW, 
EW 和 SP 分 别 表示 价值 加 权 指 数 、 等 权重 指数 和 标准 普尔 (S&P) 复合 指数 . 


SCA 演示 


% 表示 注释 . 


input date, ibm, vw, ew, sp. file’ d-ibmvwewsp6230.txt’ 
% Load data into SCA and name the columns date, 
% ibm, vw, ew, and sp. 


ibm-ibm*100 % Compute percentage returns 


desc ibm % Obtain descriptive statistics of ibm 


VARIABLE NAME Is IBM 
NUMBER OF OBSERVATIONS 10446 
NUMBER OF MISSING VALUES 0 
STATISTIC STD. ERROR STATISTIC/S.E. 
MEAN 0.0523 0.0161 3.2457 


VARIANCE 2.7163 
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STD DEVIATION 1.6481 

C.V. 31.4900 

SKEWNESS 0.0775 0.0240 

KURTOSTS 10.2144 0.0479 
QUARTILE 

MINIMUM -22.9630 

IST QUARTILE -0.8380 

MEDIAN 0.0000 

3RD QUARTILE 0.8805 

MAXIMUM 13.1640 
RANGE, 

MAX — MTN 36.1270 

Q3 - Qi 1.7185 


S-Plus 演示 
> Àj DOS 提示 符 , % 表示 注释 . 


> module(finmetrics) % Load the Finmetrics module. 

> x=matrix(scan(file=’d-ibmvwewsp6203.txt’), 5) % Load data 
> ibm-x[2,]*100 % compute percentage returns 

> summaryStats(ibm) % obtain summary statistics 


Sample Quantiles: 
min 1Q median aq max 


-22.96 -0.838 0 0.8807 13.16 


Sample Moments: 

mean std skewness kurtosis 
0.05234 1.648 0.0775 13.22 
Number of Observations: 10446 


1.2.2 ”收益 率 的 分 布 


对 数 收益 率 {ri;i — 1, ,NN;t = 二 1,… UT } 的 最 一 般 的 模型 是 它们 的 联合 分 
布 函数 : 


Fy (riip ee Niii TNO Tirs TNTSY 10), (1.14) 


Ep Y 是 由 一 些 变量 组 成 的 状态 向 量 , 这 些 变量 描述 了 决定 资产 收益 率 的 环境 , 6 
是 唯一 决定 分 布 函数 E, (-) 的 参数 向 量 . 概率 分 布 万 (-) 决定 了 收益 率 ra 和 Y 的 
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随机 行为 . 在 许多 金融 研究 中 , 把 状态 向 量 当 作 给 定 的 , 而 主要 关心 的 是 给 定 Y 的 
条 件 下 {rie} 的 条 件 分 布 . 因此 , 资产 收益 率 的 实证 分 析 是 要 估计 未 知 参 数 0, 并 在 
给 定 一 些 过 去 的 对 数 收益 率 的 条 件 下 对 (nu) 的 行为 做 出 统计 推断 . 

(1.14) 式 的 模型 太 广泛 了 , 以 至 于 失去 了 实际 应 用 的 价值 . 然而 , 它 却 提供 了 一 
个 一 般 的 框架 , 在 此 框架 中 , 可 以 给 资产 收益 率 建 立 一 个 适当 的 计量 经 济 模型 

有 些 爹 融 理论 , 比如 Sharpe 在 1964 年 提出 的 资本 资产 定价 模型 (Capital Asset 
Pricing Model, 简 记 为 CAPM), 考虑 的 是 在 单个 时 间 点 + 上 N 个 收益 率 的 联合 分 
Ai (也 即 fr nva) 的 分 布 ). 另外 一 些 理论 则 强调 单个 资产 收益 率 的 动态 结构 
(也 即 对 一 个 给 定 的 资产 i, (racy ,rwe} 的 分 布 ). 本 书 对 这 两 个 方面 都 给 予 了 充 
分 的 讨论 . 在 第 2~7 章 的 一 元 分 析 中 , 主要 关心 的 是 对 资产 i, {ra}, (ORAM. 
为 此 , 把 联合 分 布 分 解 成 如 下 形式 


F (7 ,Tir;89) =F (ra) F (rial ra)--* F (rir trivia. ,Tàa) 


^ 
= F (rit) [| F (ra Iri t-1.7** , fü). (1.15) 
t=2 
为 简单 起 见 , 上 式 中 略 去 了 6. 这 个 分 解 式 突 出 了 对 数 收益 率 nu 在 时 间 上 的 前 后 相 
依 性 . 因此 , 主要 的 问题 就 是 条 件 分 布 F (rie risa.) 的 具体 形式 , 特别 是 条 件 分 布 
是 怎样 随时 间 演 变 的 . 在 金融 中 , 不 同 分 布 的 具体 形式 会 导出 不 同 的 理论 . 例如 , 随 
机 游 动 假定 的 一 种 形式 就 是 条 件 分 布 F (rà (ritr 77 sa) 等 于 边际 分 布 F (rit). 
这 时 , 收益 率 在 时 间 上 是 相互 独立 的 , 从 而 是 不 可 预测 的 . 
我 们 通常 把 资产 收益 率 当 作 连续 型 随机 变量 对 待 , 尤其 是 对 低频 的 指数 收益 率 
或 股票 收益 率 , 因此 这 里 我 们 使 用 它们 的 概率 密度 函数 . 在 这 种 情况 下 , 利用 等 式 
(1.9), 我 们 把 (1.15) 式 的 分 解 写成 


T 
f (ras rir;0) = f (ring ®) [Ff (rit reer 7 78.9). (1.16) 

t=2 
对 高 频 资产 收益 率 , 离散 性 就 变 成 一 个 问题 . 例如 , 在 纽约 股票 交易 所 (New York 
Stock Exchange, 简 记 为 NYSE), 股票 的 价格 是 以 一 个 微小 量 (tick size) 的 倍数 变 
化 的 . 这 个 微小 量 在 1997 年 7 月 之 前 取 为 1/8 美元 , 而 在 1997 年 7 月 至 2001 年 
1 月 是 1/16 美元 . 因此 , NYSE 记录 的 个 股 的 收益 率 不 是 连续 型 的 . 我 们 将 在 第 5 

章 讨 论 高 频 的 股价 变化 和 在 价格 发 生变 化 之 间 的 时 间 持 续 期 . 

注释 : 2000 年 8 A 28 H, 纽约 股票 交易 所 开始 了 一 项 试验 性 的 程序 , 对 7 
只 股票 以 十 进 制 小 数 计 价 , 而 美国 股票 交易 所 (American Stock Exchange, 简 记 为 
AMEX) 开始 对 6 只 股票 和 两 种 期 权 种 类 以 十 进 制 小 数 计价 . 在 2000 4-9 A 25 H 
和 12 月 4 日 ,NYSE 分 别 增加 了 57 只 股票 和 94 只 股票 进入 该 程序 . 2001 年 1 月 
29 H, 所 有 在 NYSE 和 AMEX 交易 的 股票 都 以 十 进 制 进 行 交 易 . 口 
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(1.16) 式 启 示 我 们 在 资产 收益 率 的 研究 中 , 条 件 分 布 比 边际 分 布 更 有 意义 . 然 
而 , 边际 分 布 仍然 需要 关注 , 特别 地 , 利用 过 去 的 收益 率 数据 , 估计 边际 分 布 比 估计 
条 件 分 布 更 容易 . 另外 , 有 时 通过 实证 看 出 资产 收益 率 只 有 很 弱 的 序列 相关 性 , 从 
而 它们 的 边际 分 布 与 条 件 分 布 很 相近 . 

在 对 资产 收益 率 的 边际 分 布 进行 研究 的 文献 中 , 已 经 提 到 过 几 种 分 布 , 包括 正 
rtg. o ES). 稳定 分 布 和 正 态 分 布 的 尺度 混合 (scale mixture). 下 面 我 
们 简要 讨论 一 下 这 几 种 分 布 . 

ESAN 


金融 研究 中 传统 的 假设 是 : 简单 收益 率 {Ri [t =1, T) 是 独立 同 分 布 的 ， 
均 服 从 一 个 固定 均值 和 方差 的 正 态 分 布 . 这 个 假设 使 资产 收益 率 的 统计 性 质变 得 可 
以 处 理 , 但 它 遇 到 几 个 困难 : 第 一 , 简单 资产 收益 率 的 下 界 为 -1, 而 正 态 分 布 可 以 
取 到 实数 轴 上 的 任何 值 , 从 而 没有 下 界 ; 第 二 , 如 果 Ry 是 正 态 分 布 的 , 那么 多 期 的 
简单 收益 率 Ra [k] 就 不 再 是 正 态 分 布 的 , 因为 它 是 单 期 收益 率 的 乘积 ; 第 三 , 实证 
结果 不 支持 正 态 性 假设 , 很 多 资产 收益 率 数据 都 具有 正 的 超额 峰 度 . 

对 数 正 态 分 布 


男 一 个 常用 的 假定 是 : 资产 的 对 数 收 益 率 是 独立 同 分 布 的 且 都 服从 均值 为 内 、 
方差 为 o? 的 正 态 分 布 . 那么 在 此 假定 下 , 简单 收益 率 是 独立 同 分 布 的 对 数 正 态 分 
布 的 随机 变量 , 均值 和 方差 分 别 为 


E (Ry) = exp (u + T) — 1, Var(R,) = exp (24 +07) [exp (e?) — 1]. (1.17) 
上 式 在 研究 资产 收益 率 时 是 有 用 的 (如 利用 给 对 数 收 益 率 所 建立 的 模型 进行 预测 


时 ). 反之 , 假设 简单 收益 率 Ry 服从 对 数 正 态 分 布 , 均值 为 ma, 方差 为 ma, 则 对 应 
的 对 数 收益 率 re 的 均值 和 方差 分 别 为 


m, +1 me 
E(r,)-—ln|————— — |. Var(rj))-ln|1-4 —————|. 
s | ( = " j | end 
l4-m4 


By Ay BS Sth vr. [5] 4 Af E] LE AS BELLA FA GR ME ASS) A, 在 (n) 的 正 态 
假定 下 wi [k] 也 是 正 态 的 ， 另外, r 没有 下 界 , 并 且 由 1+R = exp(ri) 知 R 的 
下 界 也 能 满足 . 然而 , 对 数 正 态 假定 并 不 是 与 股票 的 历史 收益 率 的 所 有 性 质 都 一 臻 
的 , 特别 是 很 多 股票 收益 率 表现 出 了 正 的 超额 峰 度 . 

稳定 分 布 


稳定 分 布 是 正 态 分 布 的 自然 推广 , 它们 在 加 法 运算 下 是 稳定 的 , 这 一 点 符合 连 
续 复合 收益 率 rt 的 要 求 . 进一步 讲 , 稳定 分 布 能 刻画 股票 的 历史 收益 率 所 显示 出 
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来 的 超额 峰 度 . 然而 , 非 正 态 稳定 分 布 没 有 有 限 方差 , 这 一 点 与 大 部 分 金融 理论 相 
矛盾 . 另外 , 用 非 正 态 的 稳定 分 布 进行 统计 建 模 是 很 困难 的 . 非 正 态 稳定 分 布 的 一 
个 例子 是 柯 西 (Cauchy) 分 布 , 甚 中 关于 它 的 中 位 数 是 对 称 的 , 但 方差 是 无 限 的 . 

正 态 分 布 的 尺度 混合 

对 于 股票 收益 率 的 新 近 研 究 , 倾向 于 利用 正 态 分 布 的 尺度 混合 或 有 限 混合 . 在 
正 态 分 布 尺度 混 合 的 假定 下 , 对 数 收益 率 r 服从 均值 为 由、 方差 为 0 的 正 态 分 布 
(也 即 ri ~ N (4 中)). 但 是 ,o? 是 一 个 随机 变量 , 它 服 从 一 个 正 的 分 布 (如 o HR 
从 一 个 伽 玛 分 布 ). 正 态 分 布 的 有 限 混合 的 一 个 例子 是 


re~ (13— X) N (moi) + XN (m03), 


其 中 X 是 服从 伯 努 利 分 布 的 随机 变量 , 即 P(X = 1) = a, P(X 20) —1— o, A 
0<a<1, o? 较 小 而 o3 相对 较 大 . 例如 , 对 o = 0.05, 有 限 混 合 指 的 是 0596 的 收 
益 率 服从 N (n.03), 5%% 的 收益 率 服从 NN (2,03). 02 的 较 大 值 使 混合 把 更 多 的 “ 质 
Ti" 放 在 其 分 布 的 尾部 . 来 自 于 N (u, 03) 的 收益 率 的 百分比 较 低 , 表明 大 多 数 收益 
率 服 从 一 个 简单 的 正 态 分 布 . 正 态 分 布 有 限 混合 的 优点 包括 : ORE T IE Df (EO 
处 理性 、 具 有 有 限 高 阶 矩 和 能 刻画 超额 峰 度 . 然而 , 我 们 很 难 估计 混合 参数 (如 有 
图 1-1 显示 的 是 正 态 分 布 的 有 限 混 合 、 柯 西 分 布 和 标准 正 态 分 布 的 概率 密度 
函数 . 正 态 分 布 的 有 限 混 合 是 (1 — X)N (0,1) 十 XN (0,16), 其 中 X 为 满足 P(X = 
1) = 0.05 的 伯 努 利 随机 变量 , 柯 西 密度 函数 是 
1 
(1 +22)’ 
可 见 , 柯 西 分 布 有 比 正 态 分 布 的 有 限 混合 更 厚 的 尾部 , 而 正 态 分 布 的 有 限 混合 有 比 
标准 正 态 分 布 更 厚 的 尾部 ， 


f(z) = 


Co < HE oo. 


1-1 TEAS AIR IA PR. 稳定 分 布 和 标准 正 态 分 布 的 密度 函数 的 比较 
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1.2.8 ”多 元 收益 率 


BE re = (rios ,rwt) 是 NN 个 资产 在 t 时 刻 的 对 数 收益 率 . 第 8 章 和 第 9 章 

的 多 元 分 析 将 涉及 {rt} 二 ,的 联合 分 布 . 这 个 联合 分 布 可 以 用 与 (1.15) 式 相 同 的 方 

式 来 分 解 , 因此 分 析 集 中 在 条 件 分 布 忆 (ri lei. ,ri,6) 的 具体 形式 上 . 特别 地 ， 

rt 的 条 件 期 望 和 条 件 协 方差 阵 怎样 随时 间 演 变 是 第 8 章 和 第 9 章 讨论 的 主题 . 
随机 向 量 X = (X,,--- Xp) 的 均值 向 量 和 协 方差 矩阵 定义 为 


E(X) = p, = [E(X1).--- E (Xy)], 


Cov (X) = E» — E [(X — m) (X — m); 


假定 X 所 涉及 到 的 期 望 是 存在 的 . 当 有 来 自 于 X 的 数据 (mos ar} 时 , 样本 
均值 和 样本 协 方差 阵 定 义 为 


iy P 
fie = = dm TaD (ep) (eb) 
t=1 t=1 
假定 X 的 协 方差 矩阵 存在 , 则 这 些 样 本 统计 量 都 是 它们 对 应 的 理论 值 的 相合 估计 . 
在 金融 文献 中 , 多 元 目 态 分 布 常用 来 描述 对 数 收益 率 n 


1.2.4 收益 率 的 似 然 函 数 


(1.15) 式 的 分 解 可 用 来 得 到 一 个 资产 的 对 数 收 益 率 (mss ,rn} 的 似 然 函 数 ， 这 
里 为 了 符号 上 的 简便 , 对 数 收 益 率 中 的 下 角 标 i 省 略 不 写 ， 若 条 件 分 布 (rt|rt_1,…: 
r1,0) 是 均值 为 jn、 方差 为 2 的 正 态 分布 , 则 9 由 参数 jv, 和 o? 组 成 , 数据 的 似 然 
函数 为 


o. 2 
f(r TT: 0) = = FA evel] m exp | exe. (1.18) 


其 中 f (m;09) 是 第 一 个 观测 r 的 边际 密度 函数 , 使 似 然 函 数 达 到 最 大 值 的 6 的 值 
就 是 参数 6 的 最 大 似 然 估 计 (MLE). 因为 对 数 函 数 是 单调 的 , MLE 可 通过 最 大 化 
如 下 对 数 似 然 丙 数 得 到 : 


A 2 
finiri) oa 50) — $37 [in 2n) In (c 2) 十 Ui — 1) | 
t—2 


Ci 


对 数 似 然 函数 在 实际 中 更 容易 处 理 一 些 . 若 条 件 分 布 f (re rea, ,1;9) 不 是 正 
态 的 , 则 数据 的 对 数 似 然 函 数 可 用 类 似 的 方式 得 到 . 
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1.2.5 “收益 率 的 经 验 性 质 


本 节 所 用 数据 是 从 芝 加 革 大 学 证 券 价格 研究 中 心 (CRSP) 得 到 的 . 如 果 有 分 
红 支 付 , 则 它 也 包含 在 收益 率 之 中 了 . 图 1-2 显示 的 是 IBM 公司 股票 从 1926 年 
1 月 到 1997 年 12 月 的 月 简单 收益 率 和 对 数 收益 率 的 时 间 图 (time plot). 时 间 图 
显示 的 是 对 应 于 时 间 的 数据 . 上 方 的 图 表示 简单 收益 率 . 图 1-3 显示 的 是 价值 加 权 
(value-weighted) 市 场 指数 的 月 简单 收益 率 和 对 数 收 益 率 的 时 间 图 . 如 所 期 望 的 一 


FF, 这 些 图 表明 简单 收益 率 和 对 数 收益 率 的 基本 模式 相似 . 
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图 1-2 IBM 股票 从 1926 年 1 月 到 1997 年 12 月 的 月 收益 率 的 时 间 图 ， 


上 方 的 图 是 简单 收益 率 , 下 方 的 图 是 对 数 收益 率 


0.4 
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价值 加 权 市 场 指数 从 1926 年 1 月 到 2003 年 12 月 的 月 收益 率 的 时 间 图 . 
上 方 的 图 是 简单 收益 率 , 下 方 的 图 是 对 数 收 益 率 
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K 1-2 列 出 了 所 选 的 美国 股票 市 场 指数 和 个 股 的 简单 收益 率 和 对 数 收益 率 的 
一 些 描述 性 统计 量 的 值 . 所 列 收 益 率 是 日 收益 率 和 月 收益 率 , 它们 的 值 以 百分比 给 
出 . 所 用 数据 的 时 间 跨 度 和 样本 容量 大 小 也 在 表 中 给 出 . 从 这 个 表 中 我 们 观察 到 如 
下 几 点 : (a) 市 场 指数 和 个 股 的 日 收益 率 具 有 很 高 的 超额 峰 度 , 而 对 月 收益 率 序列 ， 
市 场 指数 的 月 收益 率 的 超额 峰 度 比 个 股 的 月 收益 率 的 超额 峰 度 高 出 许多 ; (b) 日 收 
益 率 的 均值 接近 于 零 , 而 月 收益 率 的 均值 要 稍 大 一 些 ; (e) 月 收益 率 比 日 收益 率 有 
更 大 的 标准 差 ; (d) 在 日 收益 率 中 , 市 场 指数 的 标准 差 比 个 股 的 标准 差 小 , 这 一 点 与 
通常 的 感觉 是 相符 的 ; (e) 偏 度 不 是 一 个 严重 问题 , 对 日 收益 率 和 月 收益 率 都 是 如 
此 ; (F) 描述 性 统计 量 表明 简单 收益 率 和 对 数 收益 率 的 差别 很 小 , 

1-4 显示 的 是 IBM 股票 的 月 简单 收益 率 和 对 数 收益 率 的 经 验 密度 函数 . 在 
每 个 图 中 , 虚线 是 由 表 1-2 中 的 IBM 收益 率 的 样本 均值 和 样本 标准 差 决定 的 正 态 
概率 密度 函数 . 图 像 表明 对 IBM 股票 的 月 收益 率 作 正 态 性 假定 是 值得 商检 的 ,经 
验 密度 函数 与 对 应 的 正 态 分 布 密度 函数 相 比 , 在 均值 附近 有 更 高 的 峰 , 但 尾部 更 厚 . 
换 句 话说 , 与 正 态 密度 相 比 , 经 验 密度 函数 更 高 、 更 瘦 , 但 有 更 宽 的 支撑 . 
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图 1-4 IBM 股票 的 月 简单 收益 率 和 月 对 数 收 益 率 的 经 验 密度 函数 和 正 态 密度 函数 的 比较 . 取 
样 日 期 仍然 是 1926 年 1 月 到 2003 年 12 H. 左边 的 图 是 关于 月 简单 收益 率 的 , 右边 
的 图 是 关于 对 数 收益 率 的 , 虚线 给 出 的 正 态 密度 由 表 1-2 中 给 出 的 样本 均值 和 样本 标 
准 差 决定 


1.3 其 他 过 程 


除了 收益 率 序列 以 外 , 我 们 还 考虑 波动 率 过 程 和 资产 极 值 收 益 率 的 行为 . 波动 
率 过 程 研究 的 是 收益 率 的 条 件 方差 随时 间 演 变 的 规律 . 这 是 一 个 有 趣 的 问题 , 因为 
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如 图 1-2 和 图 1-3 所 示 的 那样 , 收益 率 变化 的 大 小 随时 间 变 化 且 旦 现 出 聚 类 现象 . 
在 应 用 中 , 波动 率 在 期 权 定价 和 风险 管理 中 起 重要 作用 . 收益 率 序列 的 极 值 指 的 是 
绝对 值 大 的 正 或 负 的 收益 率 . e 1-2 说 明 收 益 率 序列 的 最 大 值 和 最 小 值 是 不 可 忽视 
的 . 负 的 极 值 收益 率 在 风险 管理 中 很 重要 , 而 正 的 极 值 收 益 率 对 持 有 空头 头寸 是 至 
关 重 要 的 . 我 们 将 在 第 7 章 中 研究 极 值 收益 率 的 性 质 和 应 用 , 例如 极 值 发 牛 的 频 
率 、 极 值 的 大 小 和 经 济 变量 对 极 值 的 影响 等 . 

本 书 考虑 的 其 他 金融 时 间 序 列 包 括 利 率 、 汇率 , 债券 收益 率 . 公司 每 股 的 季度 
IURI. 图 1-5 所 示 的 是 美国 两 种 月 利率 的 时 间 图 , 分 别 是 从 1954 年 4 月 至 2004 年 
3 月 间 的 10 年 期 和 1 年 期 具有 固定 期 限 的 国库 券 利 率 . 正如 我 们 所 期 望 的 , 这 两 
种 利率 的 变化 基本 同步 , 但 1 年 期 利率 的 波动 程度 要 更 大 一 些 . 图 1-6 给 出 了 2000 
年 1 月 到 2004 年 3 月 间 的 美元 对 日 元 的 日 汇率 时 间 图 . 从 图 中 可 以 看 出 , 在 取样 
期 间 , 外 汇 遇 到 了 偶尔 发 生 的 大 变化 . K 1-3 给 出 了 一 些 美国 金融 时 间 序 列 的 描述 
性 统计 量 的 值 , 其 中 从 CRSP 得 到 的 债券 的 月 收益 率 是 Fama 债券 组 合 的 收益 率 ， 
时 间 是 从 1952 年 1 月 到 2003 年 12 A. 利率 数据 是 从 圣 . 路 易 斯 联邦 储备 银行 
(Federal Reserve Bank of St. Louis) 得 到 的 , 3 +A BES HARM 1954 年 1 H 
8 日 开始 , 6 个 月 国库 券 的 周 利率 则 从 1958 年 12 A 12 日 开始 . 这 两 个 序列 的 截止 
日 期 都 是 2004 年 4 月 9 日 .对 利率 序列 而 言 , 期 限 越 长 , 样本 均值 越 大 , 而 样本 标 
准 差 越 小 . 对 债券 收益 率 序列 而 言 , 样本 标准 差 与 期 限 长 度 正 相关 , 而 样本 均值 对 
所 有 期 限 保持 稳定 . 这 里 所 考虑 的 大 部 分 序列 具有 正 的 超额 峰 度 . 
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图 1-5 1954 年 4 月 到 2004 年 3 月 美国 的 月 利率 的 时 间 图 : (a) 10 年 期 固定 期 限 国 库 券 利 
率 ; (b) 1 年 期 固定 期 限 国库 券 利率 
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图 1-6 2000 年 1 月 3 日 到 2004 年 3 月 26 日 间 的 美元 对 日 元 的 日 汇率 时 间 图 ， 
(a) 汇率 ; (b) 汇率 的 变化 


表 1-3 ” 某 些 美国 金融 时 间 序 列 的 描述 性 统计 量 n 


期 限 均值 标准 差 偏 度 超额 峰 度 最 小 值 最 大 值 
债券 的 月 收 功率: 1952 年 1 月 至 2003 年 12 A, T—624 
1—12 月 0.47 0.36 2.43 12.67 —0.40 3.52 
24~.36 H 0.53 0.99 1.40 12.93 —4.90 9.33 
48~60 H 0.53 1.42 0.62 4.07 5.78 10.06 
61-120 H 0.55 1.71 0.63 4.86 一 7.35 10.92 
国库 券 月 利率 : 1953 年 4 月 至 2004 年 3 H, T—612 
E: 5.80 3.01 0.96 1.27 一 0.82 16.72 
3 年 6.21 2.86 0.89 0.81 —1.47 16.22 
5 年 6.41 2.79 0.88 0.67 —1.85 15.93 
10 年 6.60 2.73 0.83 0.42 —2.29 15.32 
国库 券 周 利率 ; Wuk 2001 f£ 2 A 16 A 
3 个 月 5.51 2.76 1.14 1.88 一 0.58 16.76 
6 个 月 6.08 2.56 1.26 1.82 —2.35 15.76 


a 数据 的 值 是 百分比 . 3 个 月 期 国库 券 的 周 利率 起 始 时 间 是 1954 年 1 月 8 日 , 6 个 月 国库 券 起 始 时 间 
为 1958 年 12 月 12 日 , 正文 中 已 给 出 了 数据 来 源 . 


AFA 1-2 所 示 的 收益 率 的 经 验 特 征 , 第 2~4 章 的 内 容 涉及 收益 率 序列 的 前 
四 阶 矩 , 第 7 章 讨论 收益 率 最 小 值 和 最 大 值 的 行为 , 而 第 8 章 和 第 10 章 研究 多 个 
资产 收益 率 的 矩 及 它们 之 间 的 关系 . 第 5 章 讨论 当时 间 区 间 很 小 时 资产 收益 率 的 
性 质 , 第 6 章 介 绍 了 数理 金融 的 基本 内 容 . 
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练 2] 题 


1.1 考虑 如 下 公司 股票 从 1994 年 1 月 到 2003 年 12 月 的 日 收益 率 : American Express (axp), 
Caterpillar (cat) 和 Starbucks (sbux). 文件 d-3stock.txt(date，axp，cat，sbux) 给 
出 了 简单 收益 率 数 据 
(a) 将 简单 收益 率 用 百分比 表示 出 米 . 计算 简单 收益 率 百分比 的 样本 均值 、 样 本 标准 差 、 
PEAS aE. 样本 超额 峰 度 、 最 小 值 和 最 大 值 . 
(b) 把 简单 收益 率 转换 成 对 数 收益 率 . 
(c) 将 对 数 收益 率 用 百分比 表示 出 来 . 计算 日 对 数 收益 率 百分比 的 样本 均值 .样本 标准 
35. 样本 偏 度 、 样本 超额 峰 度 、 最 小 值 和 最 大 值 . 
(d) 对 每 只 股票 的 对 数 收 益 率 进 行 零 均值 检验 (进行 三 次 独立 的 检验 ). 对 数 收益 率 的 样 
本 均值 是 显著 地 不 同 于 零 吗 ? 在 5% 的 显著 性 水 平 下 得 出 你 的 结论 . 
1.2 考虑 从 1975 年 1 月 到 2003 年 12 月 间 的 IBM 股票 ,CRSP 价值 加 权 指 数 (VW). CRSP 
等 权重 指数 (EW) 和 标准 普尔 综合 指数 的 月 收益 率 , 重新 回答 练习 题 1.1 的 所 有 问题 . 指 
数 收益 率 已 包含 分 红 , 数据 文件 是 m-ibm3dx7503.txt. 
1.8 考虑 练习 题 1.2 中 从 1975 年 1 月 到 2003 年 12 月 的 标准 普尔 复合 指数 的 月 收益 率 . [e] 
答 下 述 问题 : 
(a) 在 数据 取样 期 间 内 , 平均 年 对 数 收 益 率 是 多 少 ? 
(b) 假定 没有 交易 费用 . 如 水 某 人 于 1975 年 初 在 标准 普尔 综合 指数 上 投资 1 美元 , 那么 
到 2003 年 底 该 投资 的 价值 是 多 少 ? 
1.4 考虑 练习 题 1.1 中 从 1994 年 1 月 到 2003 年 12 月 间 的 American Express (axp) 股票 
的 日 收益 率 . 在 5% 的 显著 性 水 平 下 进行 下 述 检验 . 
(a) 检验 收益 率 的 偏 度 为 零 的 零 假设 是 否 成 立 . 
(b) 检验 收益 率 的 超额 峰 度 为 零 的 零 假设 是 否 成 立 . 
1.5 可 在 芝加哥 的 联邦 储备 银行 得 到 每 天 的 外 汇 汇率 . 数据 是 由 纽约 的 联邦 储备 银行 认证 的 纽 
约 市 场 上 的 中 午 买 入 价 . 考虑 从 2000 年 1 月 到 2004 年 3 月 间 的 加 拿 大 元 、 欧 元 、 英镑 
和 日 元 对 美元 的 汇率 . 
(a) 计算 每 种 汇率 序列 的 日 对 数 收 益 率 . 
(b) 计算 每 种 汇率 对 数 收益 率 序列 的 样本 均值 、 样 本 标准 差 、 样 本 偏 度 、 样 本 超额 峰 度 、 
最 小 值 和 最 大 值 . 
(c) 讨论 这 些 汇 率 的 对 数 收益 率 序 列 的 经 验 特 征 . 
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本 章 讨论 线性 时 间 序 列 分 析 的 基本 理论 , 介绍 一 些 对 分 析 人 金融 时 间 序 列 有 用 的 
简单 计量 经 济 模型 , 并 将 这 些 模 型 应 用 于 资产 收益 率 . 我 们 重点 讨论 了 与 金融 应 用 
有 关 的 概念 . 理解 本 章 所 介绍 的 简单 时 间 序 列 模型 对 掌握 以 后 各 章 中 更 复杂 、 更 深 
入 的 金融 计量 模型 是 必要 而 有 益 的 . 我 们 已 有 许多 时 间 序 列 的 教科 书 可 供 参考 . 对 
线性 时 间 序 列 分 析 的 基本 概念 , 可 参见 Box, Jenkins 和 Reinsel(1994) 的 第 2 章 和 
第 3 章 , 以 及 Brockwell 和 Davis(1996) 的 第 1~3 章 . 

把 资产 收益 率 (如 股票 的 对 数 收 益 率 n) 看 成 随时 间 推 移 而 形成 的 一 族 随机 
变量 , 我 们 就 有 了 一 个 时 间 序 列 {xr,}， 线 性 时 间 序 列 分 析 提 供 了 一 人 自然 的 框架 ， 
来 研究 这 种 序列 的 动态 结构 . 本 书 所 讨论 的 线性 时 间 序 列 的 理论 包括 平稳 性 、 动 
态 相依 性 、 自 相关 函数 、 建 模 和 预测 ， 另外, 本 书 所 介绍 的 经 济 计量 模型 包括 : (a) 
简单 自 回归 (AR) 模型 ; (b) 简单 滑动 平均 (MA) 模型 ; (c) 混合 的 自 回 归 滑 动 平均 
(ARMA) 模型 ; (d) 季节 模型 ; (e) 单位 根 非 平稳 性 ; (£) 带 时 间 序 列 误差 的 回归 模 
W: (g) 刻画 长 相依 性 的 分 数 阶 差分 模型 ， 对 资产 收益 率 r, 试图 用 简单 模型 来 刻 
Ei " 与 上 时 刻 之 前 所 拥有 的 信息 之 间 的 线性 关系 . 这 里 的 信息 可 以 包括 rt 的 历史 
值 和 (1.14) 式 中 的 Y, 这 个 Y 是 描述 决定 资产 价格 的 经 济 环境 的 ， 同 样 地 , 相关 
系数 (correlation) 在 理解 这 些 模型 中 起 着 重要 作用 . 特别 地 , 所 研究 的 变量 与 其 过 
去 值 的 相关 系数 成 为 线性 时 间 序 列 分 析 的 焦点 . 这 些 相关 系数 称 为 序列 相关 系数 
(serial correlation) 或 自 相 关系 数 (autocorrelation), 它们 是 研究 平稳 时 间 序 列 
的 基本 工具 . 


2.1 平稳 性 


平稳 性 是 时 间 序 列 分 析 的 基础 ， 时 间 序 列 {r} 称 为 严 平稳 的 (strictly sta- 
tionary), 如 果 对 所 有 的 t, FERES k 和 任意 大 个 正 整 数 (者 
mx) AUR GDA (rias tie) 的 联合 分 布 是 相同 的 . 换言之 ， 严 平 稳 性 要 求 
(Ga Tta) 的 联合 分 布 在 时 间 的 平移 变换 下 保持 不 变 . 这 是 一 个 很 强 的 条 件 , 难 
以 用 经 验方 法 验证 ， 经 党 假定 的 是 平稳 性 的 一 个 较 弱 的 形式 . 时 间 序 列 {ri} 称 为 
弱 平稳 的 (weakly stationary), 如 果 rt 的 均值 与 ry Al re 的 协 方差 不 随时 间 而 
改变 , 其 中 1 是 任意 整数 . 更 具体 地 说 , (n) 是 弱 平 稳 的 , 若 (a)Er, = n, p dÉ—^ 
常数 ; (b) Cov (ri ria) = yi, 只 依赖 于 1. 在 实际 中 , 假定 我 们 有 工 个 数据 观测 点 
{re lt — 1,… 弱 平 稳 性 意味 着 数据 的 时 间 图 显示 出 7 个 值 在 一 个 常数 水 平 上 
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下 以 相同 幅度 波动 . 在 应 用 中 , 弱 平 稳 性 使 我 们 可 以 对 未 来 观测 进行 推断 , 即 预测 . 

在 弱 平 稳 性 的 条 件 中 , 我 们 隐 含 地 假定 了 r 的 前 两 阶 窍 是 有 限 的 . 由 定义 可 
见 , rn 是 严 平 稳 的 且 它 的 前 两 阶 矩 是 有 限 的 . 则 rt 也 是 弱 平稳 的 . 反之 , 一 般 是 
不 成 立 的 . 但 如 果 时 间 序 列 e, 是 正 态 分 布 的 , 则 弱 平 稳 性 与 严 平稳 性 是 等 价 的 . 本 
书 主要 考虑 弱 平 稳 序列 . 

协 方差 y = Cov (rare) MA n, 的 间隔 为 1 的 自 协 方差 . 它 具 有 两 个 重要 
PEM: (a)yo = Var (ri); (b)y ai =% - 第 二 个 性 质 成 立 是 因为 Cov (re, Pep) = 
Cov (ret) Pt) — Cov (rept, Te) = Cov (ru , T4 1), Hp =t. 

在 金融 文献 中 , 通常 假定 资产 收益 率 序 列 是 弱 平 稳 的 . 只 要 有 足够 多 的 历史 收 
益 率 数据 , 这 个 假定 可 以 用 实证 方法 验证 . 例如 , 我 们 可 以 把 数据 分 成 若干 子 样本 ， 
然后 检验 它们 的 一 致 性 . 


2.2 ”相关 系数 和 自 相 关 函 数 


两 个 随机 变量 x 和 Y 的 相关 系数 定义 为 
Cov(X,Y) _ E[(QX-—42)(Y — uy) 


U^ War War) E(X- pa) EY — ay)? 


其 中 uu 和 py 分 别 表 示 X M Y 的 均值 , 并 且 假定 方差 是 存在 的 . 这 个 系数 度量 的 
是 X 和 YY 线性 相关 的 程度 , 可 以 证 明 —1 < pry <1 H pry = pya 车 pry =0, 
则 这 两 个 随机 变量 是 不 相关 的 . 另外 , d X ALY 都 是 正 态 随机 变量 , 则 pey = 0 
当 且 仅 当 xo Y 是 相互 独立 的 . 当 我 们 有 样本 (Gn yi)) L IE, 相关 系数 可 以 由 
它 对 应 的 样本 相关 系数 相合 地 估计 出 来 : 


tL X 
V Dorr (te —3) Der (we — 9)? 


wh s= (Sox) /T, 9 (x y) /T 分 别 是 XX n y 的 样本 均值 


t=) 

自 相 关 函 数 (Autocorrelation Function, ACF) 
考虑 弱 平稳 收益 率 序 列 r. 当 我 们 考虑 n 与 它 的 过 去 值 w-; 的 线性 相依 关系 
Wf, 可 以 把 相关 系数 的 概念 推广 到 自 相 关系 数 . mr Sori 的 相关 系数 称 为 re 的 间 
隔 为 /的 自 相关 系数 , 通常 记 为 pi, 在 弱 平 稳 性 的 假定 下 它 只 是 1 的 函数 . 具体 地 说 ， 

定义 

Cov (re, 74-1) 二 Cov (rt, ri) EE 
a v/ Var (r4) Var (re—1) Var (r+) yo` 
这 里 用 到 了 弱 平稳 序列 的 性 质 Var (ri) = Var(ri-i). 由 定义 , 我 们 有 po = 1, p = 
p_ 和 —1«p <1. 另外 , 一 个 弱 平 稳 序 列 是 序列 不 相关 的 当 且 仅 当 对 所 有 ! > 0 


(2.1) 
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都 有 pi = 0. 
对 一 个 给 定 的 收益 率 样本 n) 设 r 是 样本 均值 , 也 即 二 (x re) Jr. 则 
rt 的 间隔 为 1 的 样本 自 相关 系数 为 B 


EN —9 (rt — T) (re-1 — F) 
d 1 ( (re — 7)? 


在 某 些 一 般 性 条 件 下 , P 是 p 的 相合 估计 . 例如 , 车 fr*} 是 独立 同 分 布 Gid) 序列 
H E (r?) < oo, W 所 渐 近 地 服从 均值 为 0、 方差 为 1/T 的 正 态 分 布 ( 见 Brockwell 
和 Davis (1991) 的 定理 7.2.2). 在 实际 中 , 这 个 结果 可 用 来 检验 原 假 设 Ho : p —0 
和 备 择 假 设 Ha : pi 关 0. 检验 统计 量 就 是 通常 的 + 比 , 即 v 歼 5， 它 渐 近 地 服从 标 
准 正 态 分 布 . 一 般 地 , re 的 间隔 为 1 的 样本 自 相关 系数 定义 为 


, : 
= T; —TUAT-1 — Tr 
Bi ss tt (re —P) (Tet 7r) bsi r-i. (2.2) 


"p (ri TA 7)? 
Ti {rt} 是 一 个 独立 同 分 布 序列 , 满足 E (r7) < oo, 则 对 任意 国定 的 正 整 数 1, 六 渐 
近 地 服 从 均值 为 0. 方差 为 1/T 的 正 态 分 布 . 喝 一 般 地 , AF r 是 一 个 弱 平 稳 序列 ， 
满足 ri = u+ p Via, i, 其 中 wo = 1, g HAE HEAR, {a;} 是 高 斯 白 噪声 序列 , 则 对 


1 > q, pr 渐 近 地 服从 均值 为 0、 方 差 为 人 JT 的 正 态 分 布 . 在 时 间 序列 
的 文献 中 , 称 此 结果 为 Bartlett 公式 (参见 Box, Jenkins 和 Reinsel (1994)). 关于 样 
本 上 自 相 关 函 数 的 渐 近 分 布 的 更 多 信息 , 参见 Fuller(1976) 的 第 6 ZEA Brockwell 和 
Davis (1991) 的 第 7 章 . 

检验 单个 ACF 

对 一 个 给 定 的 正 整数 |, 可 用 前 面 的 结果 来 检验 Ho: pi =0 和 H : a #0. 1€ 
验 统计 量 为 
pt 

VQ T2» R/T 
如 果 {r} 是 一 个 平稳 高 斯 序列 并 且 满 足 当 7 > 1 时 pi = 0, 则 该 c 比 渐 近 地 服从 
标准 下 态 分 布 . 决策 规则 是 : 当 |t- 比 | > Zay2z 时 拒绝 Ho, SEP 和 va 是 标准 正 态 分 
布 的 100(1 — a/2) 分 位 点 . 

对 有 限 样本 , 5, 是 o, 的 有 偏 估计 . 偏差 的 阶 是 1/T, 这 在 样本 容量 T 较 小 时 是 
不 容 忽 视 的 . 但 在 大 多 数 金融 应 用 中 , T 相对 较 大 , 故 这 个 偏差 并 不 严重 . 

混成 检验 (Portmanteau Test) 


金融 应 用 中 常 需要 检验 T 的 几 个 自 相关 系数 是 否 同 时 为 零 . Box 和 Pierce 


t-ratio = 
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(1970) 提出 了 “混成 ”检验 统计 量 
Q* (m) - T» / fi 
1=1 


来 检验 原 假设 Ho : Mv 和 和 备 择 假设 HE, : x c {1,--- , m), p; £ 0. 
在 (i) 为 满足 一定 矩 条 件 的 独立 同 分 布 序列 的 假定 下 , Q* (m) 渐 近 地 服从 自由 度 
为 m 的 x? 分 布 . 

Ljung 和 Box (1978) 为 了 提高 有 限 样本 时 检验 的 功效 把 统计 量 Q* (m) 修改 为 


Q(m) =T(T+2) Y ^ FL. (2.3) 
l=1 

决策 规则 是 : 当 Q(m) > x2 时 拒绝 Ho 其 中 X2 是 自由 度 为 m 的 x? 分 布 的 
100(1 — a) 分 位 点 . 大 部 分 软件 包 都 会 给 出 Q(m) 的 p 值 . 决策 规则 是 : 4 p 值 小 
于 等 于 显著 性 水 平 a 时 拒绝 Ho. 

在 实际 中 , m 的 选择 会 影响 O(m) NAH. 常用 到 几 个 m 值 . BUST ee, 
取 m3 ln (T) 会 有 较 好 的 功效 . 在 分 析 季 节 性 时 间 序 列 时 , 这 个 一 般 性 的 规则 需要 
修正 , 因为 此 时 间隔 为 季节 性 周期 的 倍数 的 自 相 关系 数 是 很 重要 的 . 

由 (2.2) 式 定义 的 函数 fi, jo. 称 为 ri 的 样本 自 相关 函数 (ACF). 这 个 函数 
在 线性 时 间 序 列 分 析 中 起 着 重要 作用 . 事实 上 , 一 个 线性 时 间 序 列 模型 可 完全 由 其 
ACF 决定 , 并 且 线 性 时 间 序 列 的 建 模 用 样本 ACF 来 刻画 数据 的 线性 动态 关系 . 图 
2-1 所 示 的 是 IBM 股票 从 1926 年 1 月 至 1997 年 12 月 间 的 月 简单 收益 率 和 对 数 
收益 率 的 样本 自 相 关 函 数 . 这 两 个 样本 自 相 关 函 数 非常 接近 , 都 表明 即便 TBM 股 
票 收益 率 有 序列 相关 性 , 其 相关 性 也 很 小 . 两 个 样本 ACF 的 值 均 在 两 个 标准 差 之 
内 , 说 明 在 5% 水 平 下 它们 与 零 没 有 显著 差别 . 此 外 , 对 于 简单 收益 率 , Ljung- Box 
统计 量 为 Q(5) = 5.4, Q(10) = 14.1, 对 应 的 p 值 分 别 为 0.37 和 0.17( 基 于 自由 度 
Jg 5 I 10 的 x? 分 布 ). 对 于 对 数 收益 率 , Q (5) = 5.8, Q (10) = 13.7, p 值 分 别 为 
0.33 和 0.19. 这 就 证 实 了 IBM 股票 收益 率 没 有 显著 的 序列 相关 性 . 图 2-2 所 示 的 
是 价值 加 权 指 数 (该 数据 来 白 芝 加 哥 大 学 的 CRSP) 的 月 收益 率 的 两 个 同样 的 函数 ， 
在 596 水 平 下 这 两 个 收益 率 序列 都 存在 茶 些 显著 的 序列 相关 性 . 对 于 简单 收益 率 ， 
Ljung-Box 统计 量 为 Q (5) = 27.8, Q (10) = 36.0; 而 对 于 对 数 收益 率 , Q (5) = 26.9, 
Q (10) = 32.7. 3X 4 个 检验 统计 量 的 p 值 都 小 于 0.000 3, 表明 价值 加 权 指 数 的 月 收 
益 率 是 序列 相关 的 . 因此 , 市 场 指数 的 月 收益 举 要 比 个 股 的 月 收益 举 有 更 强 的 序列 
相关 性 . 

在 金融 文献 中 , 资本 资产 定价 模型 (CAPM) 理论 的 一 种 形式 就 是 假定 资产 收 
益 率 序列 {r} 是 不 可 预测 的 , 且 没 有 自 相 关 性 . 零 自 相关 系数 的 检验 被 用 来 作为 有 
效 市 场 假定 是 否 成 立 的 判定 工具 . 然而 , 股价 的 决定 方式 和 指数 收益 率 的 计算 方式 
可 能 会 导致 在 观察 到 的 收益 率 序 列 中 有 自 相 关 性 , 尤其 是 在 分 析 高 频 金 融 数 据 时 . 
第 5 章 将 讨论 此 方面 的 问题 . 
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(a) 简单 收益 率 
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(b) 对 数 收益 率 
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2-1 IBM 股票 从 1926 年 1 月 到 1997 年 12 月 间 的 月 简单 收益 率 和 月 对 数 收益 率 的 样本 
自 相关 函数 . 每 个 图 中 的 两 条 横 线 表示 样本 自 相关 函数 的 两 个 标准 差 的 上 下 限 


(a) 简单 收益 率 
0.2 
0.1 
O 00 
—(),1 
-0.2 
0 20 40 60 80 100 
间隔 
(b) 对 数 收益 率 
0,2 
0.1 
5 0.0 
= 
—(.1 
0.2 
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间隔 


图 2-2 美国 股票 市 场 价值 加 权 指数 从 1926 年 1 月 到 1997 年 12 月 间 的 月 简单 收益 率 和 月 
对 数 收益 率 的 样本 自 相 关 函 数 .每 个 图 中 的 两 条 横 线 表 示 样 本 自 相 关 函 数 的 两 个 标 
准 差 的 上 下 限 


SCA 演示 


给 出 了 输出 结果 , % 表示 注释 . 
input ibm. file 'm-ibm2697.txt' % Load data 
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acf ibm. maxl 10. $% Compute 10 lags of ACF. 


NAME OF THE SERIES . 5 i pau a i 75 IBM 
TIME PERIOD ANALYZED . . - pou Ha AX B64 
MEAN OF THE (DIFFERENCED) SERIES e 2 5 0.0142 
STANDARD DEVIATION OF THE SERIES . . . 0.0670 
T-VALUE OF MEAN (AGAINST ZERO) . . . . 6.2246 


AUTOCORRELATIONS  * ACF(lag 1 to 10), Standard error, Q(m) 


l- 10 .07 .01 -.02 -.01 -.01 -.01 -.00 .07 .05 .04 
ST.E. .03 .03. .03 .03 .03 Ba .03 .03 A A 
Q 4.8 x9 5.4 5.4 Sid 8:5: 5.5:/10,2 12.6 14.1 


p-1-cdfc(5.4,5) % Calculate p-value 


print p * Print p-value 
.369 
S-Plus 演示 
给 出 了 输出 结果 , > 表示 DOS 提示 符 . 


> ibm-scan(file-'m-ibm2697.txt') $ Load data 
> autocorTest (ibm, lag=5) % Perform Q(5) test 


Test for Autocorrelation: Ljung-Box 
Null Hypothesis: no autocorrelation 
Test Statistics: 


Test Stat 5.4474 
p.value 0.3638 


Dist. under Null: chi-square with 5 degrees of freedom 
Total Observ.: 864 


> ibm-log(ibm«1) % Convert into log returns 
> autocorTest(ibm,lag-5) 


Test Statistics: 


Test Stat 5.7731 
p.value 0.3289 


Dist. under Null: chi-square with 5 degrees of freedom 


2.3 ”和 白 噪 声 和 线性 时 间 序 列 


ARF 


时 间 序 列 {r} 称 为 一 个 白 噪 声 序列 , 如 果 {r*} 是 一 个 具有 有 限 均值 和 有 限 方 
差 的 独立 同 分 布 随机 变量 序列 . 特别 地 , 车 r 还 服从 均值 为 0、 方 差 为 o? WES 
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分 布 , 则 称 这 个 序列 为 高 斯 白 噪 声 . 对 白 噪声 序列 , 所 有 白 相 关 函 数 为 零 . 在 实际 应 
用 中 , 如 果 所 有 样本 自 相 关 函 数 接近 于 零 , 则 认为 该 序列 是 白 噪声 序列 . 基于 图 2.1 
和 图 2-2, TBM 股票 的 月 收益 率 接近 白 噪声 , 而 价值 加 权 指 数 的 收益 率 不 是 白 噪 声 . 

价值 加 权 指 数 收益 率 的 样本 自 相关 系数 的 性 质 启示 我 们 在 对 一 些 资产 收益 率 
进行 更 深入 的 分 析 之 前 , 有 必要 对 其 序列 相关 性 进行 建 模 . 下 面 我 们 讨论 一 些 简单 
的 时 间 序 列 模型 , 它们 对 时 间 序 列 的 动态 结构 的 建 模 非常 有 用 , 而 且 所 述 的 思想 在 
以 后 给 资产 收益 的 波动 率 建 模 时 也 是 很 有 用 的 . 

线性 时 间 序 列 

时 间 序 列 {re} 称 为 线性 序列 , 如 果 它 能 写成 


n= n M Wari, (2.4) 
i=0 
其 中 u 是 re 的 均值 , wo = 1, {ar} 是 零 均 值 独立 同 分 布 (假定 a 的 分 布 是 合理 定 
义 的 ) 的 随机 变量 序列 (也 即 {a} 是 白 噪声 序列 ). 我 们 在 以 后 可 以 看 出 , a, 表示 
时 间 序列 在 t 时 刻 出 现 了 新 的 信息 , 因此 常 将 a, 称 为 时 刻 t 的 新 息 (innovation) 或 
扰动 (shock). 本 书 中 我 们 主要 关心 的 是 a, 为 连续 型 随机 变量 的 情形 .然而 并 不 是 
所 有 金融 时 间 序 列 都 是 线性 的 . 第 4 章 将 研究 非 线性 性 和 非 线性 模型 
在 (2.4) 式 定义 的 线性 时 间 序 列 中 , 系数 w 决定 了 re 的 动态 结构 , 在 时 间 序 
列 文献 中 这 些 系 数 称 为 r 的 p- 权重 . 若 7 是 弱 平稳 的 , 我 们 利用 {a} 的 独立 性 
可 以 很 容易 得 到 r 的 均值 和 方差 


E(n)—p, Var(r)=02 9 vi, (2.5) 
i=0 


其 中 o2 是 a, 的 方差 .因为 Var (ri) < +00, 所 以 (02) 必须 是 收敛 序列 , 即 当 
i— oo 时 y? — 0. 相应 地 , 随 着 i 的 增 大 , 远 处 的 扰动 ari 对 rs 的 影响 会 逐渐 消 
K. 

re 的 间隔 为 1 的 自 协 方差 为 


Y= Cov (TunT) = E (È vUa, ) (5 s] 
i=0 j-0 


=E (E vemm 


1-0 


ox 
一 F3 Wj E (a¢_1_;) 


j=0 


=0 9 | Vitia. (2.6) 


j-—0 
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因此 , y- 权重 与 r 的 自 相关 系数 有 如 下 关系 : 


n=- 1>0, (2.7) 
其 中 wo = 1. 线性 时 间 序列 模型 就 是 用 来 描述 mw 的 办 权重 的 计量 经 济 模型 和 统 
计 模型 . 对 弱 平稳 序列 而 言 , 当 i — oo 时 vi — 0, 从 而 随 着 L 的 增加 pi 收敛 到 0. 
对 于 资产 收益 率 而 言 , 这 意味 着 , 如 同 所 期 望 的 那样 , 当 1 较 大 时 , 当前 收益 率 r 对 
遥远 过 去 的 收益 率 rua 的 线性 依赖 会 消失 . 


2.4 ”简单 的 自 回 归 模 型 


CRSP 价值 加 权 指 数 的 月 收益 率 rn, 具有 统计 显著 的 间隔 为 1 的 自 相关 系数 . 
这 个 事实 说 明 延 迟 的 收益 率 re 在 预测 7, 时 可 能 会 有 用 . 利用 这 样 的 预测 功用 的 
一 个 简单 模型 是 

Tt = Qo + irii + at, (2.8) 

其 中 {a,} 是 均值 为 0, 方差 为 o2 的 白 噪声 序列 . 这 个 模型 与 众所周知 的 简单 线性 
回归 模型 有 相同 的 形式 , 这 里 r 是 因 变量 , rı 是 自 变 量 . 在 时 间 序 列 的 文献 中 ， 
模型 (2.6) 称 为 一 阶 自 回归 (AR) US, 或 简称 AR(1) 模型 . 该 模型 也 广泛 地 应 用 
在 随机 波动 率 的 建 模 中 , 只 不 过 那 时 n, 由 它 的 对 数 波动 率 所 代替 , 见 第 3 章 和 第 
12 章 . 

(2.8) 式 中 的 AR(1) 模型 有 若干 类 似 于 简单 线性 回归 模型 的 性 质 . 但 是 , 这 两 
个 模型 之 问 存在 一 些 显著 的 差异 , 这 一 点 我 们 将 在 以 后 讨论 . 这 里 我 们 需要 注意 到 
这 样 一 个 事实 : 由 AR(1) 模型 可 推 得 , 在 已 知 过 去 收益 率 rt_1 的 条 件 下 ， 


E(ri|ri-1i) = do + ir, Var (re rea.) = Var (at) = 02 


也 就 是 说 , AeA ri, SAE BF bo + dom 为 中 心 取 值 , 标 
准 差 是 oa. 给 定 na 条 件 下 , 7 与 reli > 1) FER, 这 是 AR(1) 的 马尔 可 夫 性 . 
当然 , 有 些 情况 下 noa 不 能 单独 决定 re 的 条 件 期 望 , 此 时 需要 更 复杂 一 些 的 模型 . 
AR(1) 模型 的 直接 推广 是 AR(p) 模型 : 


re = ġo + Oitt-1 H+ pri p + at, (2.9) 
其 中 p 是 非 负 整 数 , {ai} 的 定义 跟 (2.8) 式 中 一 样 . 这 个 模型 表示 : 给 定 过 去 的 数 
据 时 , 过 去 的 p 个 值 rili =1,--- ,p) 联合 决定 r 的 条 件 期 望 . AR(p) 模型 与 以 p 
个 延迟 值 作为 自 变量 的 多 元 线性 回归 有 相同 形式 . 
2.4.1 AR, 模型 的 性 质 
为 了 有 效 地 利用 AR 模型 , 有 必要 对 它 的 基本 性 质 进行 研究 . 我 们 详细 地 讨论 
AR(1) 模型 和 AR(2) 模型 的 性 质 , 对 一 般 的 AR(p) 模型 本 节 只 给 出 其 结果 . 
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AR(1) 模型 

我 们 首先 讨论 (2.8) 式 定义 的 AR(1) 模型 的 弱 半 稳 性 的 充分 必要 条 件 . 假定 序 
列 是 弱 平稳 的 , 则 E (re) = u, Var (re) = Yo, Cov (ra fij) = qj; 其 中 u, yo 是 常数 ， 
y FÆ j HRAMI t EK. 我 们 容易 得 到 序列 的 均值 、 方 差 和 自 相 关系 数 . 对 (2.8) 
RAAME, 因为 也 (oa) = 0, 所 以 


E (ri) = ġo + ġ1E (rii). 
在 平稳 性 的 条 件 下 , E (ri) = E(rca) = u, 从 而 


上 = 加 十 和 4 R E(n)=p= Go 


1 一 页 
这 个 结果 有 两 个 含义 : 第 一 , s 71, 则 mm 的 均值 存在 ; 第 二 , v. 的 均值 为 0 当 
且 仅 当 do = 0. 因此 , 对 平稳 AR(1) 过 程 , 常数 项 po 与 re 的 均值 有 关 , w = 0 意 
味 着 E(r,) — 0. 

我 们 利用 po — (1- d1i)u 可 以 把 AR(1) 模型 写成 如 下 形式 


ri— H= (Tt — H) ai, (2.10) 
重复 代入 , 由 上 述 方 程 可 推 得 


T, — [b= Q4 + 1041.1 + $2a, 2 T: 
OG 


E Yas. (2.11) 


i=0 


因此 , re 一 jp 是 aci, i > 0 的 线性 函数 .利用 这 个 性 质 和 (a4). 的 独立 性 , 我 们 有 
E [(r: — y) at+1| = 0, 由 平稳 性 的 假定 ， 我 们 有 Cov (re_1;at) =E [(ri-1 一 u) a] =0. 
此 性 质 可 从 直观 上 看 出 来 , 因为 ri 发 生 在 t 时 刻 之 前 而 a 不 依赖 于 任何 过 去 的 
信息 . 对 (2.10) 两 边 平方 , 然后 取 期 望 得 到 


Var (r4) = 7} Var (ry 3) to, 


其 中 o; 是 ay 的 方差 , 这 里 我 们 用 到 “rm_1 与 as 的 协 方差 为 零 * 这 样 一 个 事实 . 而 
在 平稳 性 的 假定 下 , Var (ri) = Var (ria), 故 

oa 
1—9f 
ERE o? < 1 时 成 立 . 因为 方差 是 非 负 有 限 的 , 故 要 求 6? < 1. 这 样 , 由 AR(1) 模 
型 的 弱 平稳 性 可 推 得 -1< by <1. 反之 , 若 -1 < 加 <1, H (211) 式 和 序列 (a) 
的 独立 性 , 我 们 可 以 证 明 v, 的 均值 和 方差 是 有 限 的 , 参见 (2.5) 式 . 另外 , 由 (2.6) 
X, r 的 自 协 方差 也 是 有 限 的 . 从 而 , AR(1) 模型 是 弱 平稳 的 . 综 上 所 述 , (2.8) RE 
义 的 AR(1) 模型 是 弱 平 稳 的 充分 必要 条 件 是 | 办 | < 1. 


Var (ri) = 
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AR(1) 3 2 && & 38 X s 
在 (2.10) 式 两 端 乘 以 ar, 再 取 期 望 , 利用 a, 与 ra 的 独立 性 , 我 们 有 
E [ae (re — )| = E [ay (ri-1 — 4)] + E (a?) =E (a?) 5. 
其 中 o? 是 a, 的 方差 . 对 (2.10) 式 两 端 同 乘 以 (r4; u) 取 期 望 , 再 利用 上 述 结果 ， 
我 们 有 
(zd Vedi +o2, 当 1 一 0 时 ， 
aya, 当 1 > OIN, 


这 里 利用 了 y = y 这 个 性 质 . 因此 , 对 (2.8) 式 定义 的 弱 平 稳 AR(1) 模型 , 有 


an 
1 — ¢? 
由 后 一 方程 , , 的 自 相 关 函 数 (ACF) 满足 


Var (rt) = Yo = 


H 4-261311. 1290. 


a=hpir, 0290. 
po — 1, WA p, — di. 这 个 性 质 表 明 弱 平稳 AR(1) 序列 的 自 相 关 函 数 从 po — 1 
开始 以 比率 为 办 的 指数 速度 衰减 . 对 正 的 $1, AR(1) 模型 的 白 相 关 函 数 (ACE) 图 
像 呈 现 漂亮 的 指数 衰减 . 对 负 的 加 , AR(1) 模型 的 ACF 由 上 下 两 个 都 以 92 比率 
指数 衰减 的 图 像 组 成 . 图 2-3 所 示 的 是 当 加 = 0.8 Al 9; = —0.8 时 的 AR(1) 模型 
的 ACF 图 . 


(a) (b) 
1.0 1.0 


[em 
5 0.0 O 0.0 
= < 
—0.5 —0.5 


-1.0 —1.0 
0 2 4 6 8 0 2 4 6 8 
间隔 间隔 
图 2-3 AR(1) 模型 的 自 相关 函数 : (a) $1 = 0.8; (b) à: = —0.8 
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AR(2) 模型 
AR(2) 模型 形 如 
Tt = Qo + diTi-1 + oTt 2 + ae. (2.12) 


利用 与 AR(1) 情形 相同 的 方法 , 我 们 得 到 : 只 要 i +o #1, 就 有 


利用 óo = (一 血 — ġ2) p, RITTE AR(2) 模型 改写 成 
re — U= Qi (rii — B) + 2 (ri-2 — i) + ai. 
在 上 式 两 端 同 乘 以 re- n. 我 们 有 
(re-i— H) (Ti — H) — & (re — B) (ria — U) +62 (re-i — B) (rez — u) + (re — H) at, 
再 取 期 望 , 并 利用 当 1 > 0 时 Ellr- u) ae] = 0 这 个 性 质 , 我 们 得 到 
N= piyi- + 2-2, 0» 0. 


这 个 结果 称 为 平稳 AR(2) 模型 的 矩 方程 , 在 上 式 两 端 同 除 以 yo, 得 到 的 ACF 的 
性 质 : 


Pi = drpi-1 + bopi-2, 0» 0. (2.13) 
特别 地 , 间隔 为 1 的 ACF 满足 


Pi = Ó1po + ó2p—1 = (1 + opr. 
因此 , 对 半 稳 的 AR(2) 序列 re, 我们 有 


po = 1, 

_ Qi 

~ 1-49 

pi = ipi- + depi-a, 122. 


(2.13) 式 的 结果 说 的 是 : 平稳 AR(2) 序 刻 的 ACF 满足 二 阶 差 分 方程 


pi 


(1 — ¢1B — $2?) pı — 0, 


其 中 B 是 向 后 推移 算 子 , HI Bp, = p1. 这 个 差分 方程 决定 了 平稳 AR(2) 序列 的 
ACF 的 性 质 , 也 决定 了 re 的 预测 行为 . 在 时 间 序 列 的 文献 中 , 有 时 也 用 Lo de 
B 来 表示 向 后 推移 算 子 . 这 里 L 表示 延迟 算 子 ， 加 di Lap, = A'k—1- 
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与 前 面 的 差分 方程 相对 应 的 是 二 次 多 项 式 方 程 
1 — dx — bor? =0. (2.14) 


这 个 方程 的 解 是 
(il Voy + 4¢2 

z= ie 
在 时 间 序 列 文献 中 , 称 这 两 个 解 的 倒数 为 AR(2) 模型 的 特征 根 . 用 w 和 wo 表示 这 
两 个 解 . 如 果 两 个 wi 部 是 实 值 , 则 模型 的 二 次 差分 方程 能 分 解 成 (1 一 w1B) (1 — wB) 
的 形式 , 这 时 AR(2) 模型 可 以 看 成 两 个 AR(1) 模型 的 又 加 , 即 一 个 AR) 模型 满 
足 另 一 个 AR(1) 模型 . 因此 , 这 时 m 的 ACE 是 两 个 指数 衰减 的 混合 . 然而 . 如 果 
$t +402 < 0, MW wi Al wo 都 是 复数 (KA BAHN), 这 时 7, 的 ACE 将 呈现 出 减 
幅 的 正弦 和 余弦 波 的 图 像 . 在 商业 和 经 济 的 应 用 中 , 复 特征 根 很 重要 , 它们 会 导致 
商业 环 的 出 现 . 对 经 济 时 间 序 列 模型 来 说 , 复 值 特征 根 也 很 常见 . 对 由 (2.12) 式 定 
MAS, 带 一 对 共 斩 复 特征 根 的 AR(2) 模型 , 随机 环 的 平均 长 度 为 


cos-1 [@1/ (2/.—62)]' 
其 中 反 余 弦 函 数 的 值 以 弧度 表示 ， 如 果 我 们 将 复数 解 写成 a + bi 的 形式 ， 其 中 
i= V 一 1, 则 我 们 有 内 = 2a, d2 = —(a? + b”), FFA 

| PTS 

—— cos—(a/ Va? + 52) 


其 中 Va? +e at bi 的 模 . 

图 2-4 显示 的 是 四 个 平稳 AR(2) 模型 的 ACF. (b) 图 是 AR(2) 模型 (1 -—0.6B 

+0.4B?) r, = at 的 ACF. 因为 6? + 4¢2 = 0.36 +4 x (—0.4) = —1.24 < 0, 故 这 个 
AR(2) 模型 包含 两 个 复 特征 根 , 从 而 它 的 ACE 呈现 出 减 幅 的 正弦 和 余弦 波状 . 其 
他 三 个 AR(2) 模型 都 是 有 实 特征 根 的, 它们 的 ACF 呈 指 数 衰减 . 
例 2.1 作为 说 明 , 考虑 美国 的 实际 国民 总 产值 (GNP) 的 季度 增长 率 , 我 们 已 经 
作 了 季节 调整 , 时 间 从 1947 年 第 二 个 季度 到 1991 年 第 一 个 季度 . 图 2-5 给 出 了 这 
个 时 间 序 列 的 时 间 图 , 并 且 该 序列 在 第 4 章 中 将 作为 一 个 非 线性 经 济 时 间 序 列 的 
例子 . 这 里 我 们 简单 地 用 AR(3) 模型 来 分 析 这 组 数据 . 用 or, 表示 增长 率 , 我 们 可 
以 用 2.4.2 节 的 建 模 方法 来 估计 这 个 模型 . 拟 合 的 模型 是 


re = 0.004 7 --0.35r,; -- 0.18r, 9 — 0.14ry-3 -- a4, 64 = 0.009 8. (2.15) 
把 上 述 模型 改写 成 


re 一 0.35m 3 一 0.18m_ 2 十 0.147 3 = 0.004 了 十 at， 
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我 们 得 到 对 应 的 三 阶 差分 方程 


1 — 0.35B — 0.18B? + 0.14B? = 0, 


它 可 以 分 解 成 
(1+0.52B) (1 — 0.87B + 0.27 B?) = 0. 


第 一 个 因子 (1 + 0.528) 表明 所 考虑 的 GNP 增长 率 有 指数 衰减 的 特征 . 对 第 二 个 
因子 1 — 0.87B — (—0.27) B? = 0,  ¢? + 49» = 0.87? + 4(—0.27) = —0.323 1 < 0. 
因此 , 这 个 AR(3) 模型 的 第 二 个 因子 说 明美 国 的 实际 GNP 的 季度 增长 率 中 存在 随 
机 商业 环 . 这 一 点 是 合理 的 , 因为 美国 经 济 经 历 了 膨胀 和 紧缩 期 . 随机 环 的 平均 长 
度 大 约 为 

2(3.14159) 


k= ah Be 10.83 (季度 ) , 


(a) (c) 
1.0 1.0 


U5 u.5 


已 一 
A i 
2 0.0 = U.ü 
一 0.5- 一 0.5 
—1.0 
o 5 W 15 名 
间隔 
(b) 
1.0 
0.5 
ty 
O 0.0 
< 
一 0.5 
一 1.0 
co $ 33 dB 如 0 6&6 10 WwW 2 
间隔 fia] 


2-4 AR(2) 模型 的 自 相 关 函 数 : (a) 办 = 1.2, do = —0.35; (b) à1 一 0.6, 
ga = —0.4; (c) $1 = 0.2, $a = 0.35; (d) $1 = —0.2, $a = 0.35 


这 大 约 为 3 f£. 车 用 一 个 非 线性 模型 去 把 美国 经 济 分 解 成 “膨胀 期 ， 和 “紧缩 期 * 
的 话 , 数据 将 表明 紧缩 期 平均 长 度 大 约 为 3 个 季度 , 而 膨胀 期 的 平均 长 度 为 3 年 
( 见 第 4 章 中 的 分 析 ). 10.83 个 季度 是 这 两 个 平均 长 度 的 折 中 . 这 里 得 到 的 周期 性 
在 国民 经 济 增长 率 的 研究 中 是 常见 的 , 例如 许多 OECD 国家 也 存在 类 似 上 面 所 述 
的 现象 . 
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1950 1960 1970 1950 1990 
年 
2-5 从 1947 年 第 二 个 季度 到 1991 年 第 一 个 季度 美国 的 实际 国民 总 产值 
增长 率 的 时 间 图 . 数据 按 季 节 调 整 并 以 百分比 计数 


平稳 性 

AR(2) 时 间 序 列 的 平稳 性 条 件 是 它 的 两 个 特征 根 的 模 都 小 于 1. 在 这 个 条 件 
F, 递 推 式 (2.13) 保证 模型 的 自 相 关 函 数 随 间隔 1 的 增加 而 趋 于 0. 这 个 趋 于 0 的 
性 质 是 一 个 时 间 序 列 平稳 的 必要 条 件 . 事实 上 , 这 个 条 件 也 适用 于 AR(1) 模型 , 这 
时 特征 多 项 式 是 1 一 内 z = 0, FIERA w= 1/2 = $1, 要 使 ri 是 平稳 的 , 必须 有 内 
的 模 小 于 1. 而 前 面 已 证 明 过 , 对 平稳 AR(1) 模型 有 p = o1, 这 隐 含 着 当 1 一 cc 
时 , 有 pi 0. 

AR(p) 模型 


AR(1) 模型 和 AR(2) 模型 的 结果 可 以 推广 到 由 (2.9) 式 定 义 的 AR(p) 模型 . 对 
平稳 的 AR(p) 序列 , 其 均值 为 


E(r) = — 


假定 分 母 不 等 于 0. 模型 对 应 的 多 项 式 方程 为 
1— dix — doa” —...— px” = 0, 


称 之 为 该 AR(p) 模型 的 特征 方程 .如 果 这 个 方程 的 所 有 解 的 模 都 大 于 1, 则 序列 
{re} 是 平稳 的 . 同样 , 解 的 倒数 为 该 模型 的 特征 根 . 因此 , 平稳 性 要 求 所 有 特征 根 的 
模 都 小 于 1. 对 于 平稳 AR(p) 序列 而 言 , 其 自 相关 函数 满足 方程 


(1—¢, B — ¢2B? —--.—¢,B”)p, —0, 1>0. 


自 相 关 函 数 的 图 像 呈 现 出 减 电 的 止 弦 、 AGRA BE MATA, 具体 形状 取决 于 
其 特征 根 的 性 质 . 
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2.4.2 ”实际 中 怎样 识别 AR 模型 


在 实际 应 用 中 , 一 个 AR 序列 的 阶 p 是 未 知 的 , 必须 根据 实际 数据 来 决定 . ok 
解 阶 p 的 问题 叫做 An 模型 的 定 阶 .在 时 间 序 列 文献 中 这 个 问题 已 被 广泛 研究 
it. 一般 有 两 个 决定 p 的 方法 ; 第 一 种 方法 是 利用 偏 相关 函数 (PACF, Partial Auto 
Correlation Function); 第 二 种 方法 是 用 某 个 信息 准则 函数 . 

1m E 40 X f HK 


平稳 时 间 序 列 的 PACF 是 它 的 ACF 的 一 个 函数 , 它 在 给 AR 模型 定 阶 时 是 一 
个 有 用 的 工具 . 一 个 简单 而 有 效 的 引进 PACF 的 方式 是 考虑 如 下 一 连 串 的 AR 模 
nm. 


re = Por + O1Te-1 + Ert, 

Te = b0,2 +0121 + Go, 9T1-2 + Ct, 

re = $0,3 + O1aTt—-1 + Q2,3Ti 2 + 3,313 + €31, 

T, = Qo, + Orari PoaTt 2 $3,4Ti 3 + O4aTe—4 + Cat, 


ee | 


其 中 , o, ; 是 常数 项 , Qij 是 rei 的 系数 , ej; 是 AR(G) 模型 的 误差 项 . 这 些 模型 都 
是 多 元 线性 回归 的 形式 , 可 用 最 小 二 乘法 来 估计 . 事实 上 , 由 于 它们 是 按 阶 的 高 低 
排列 的 , 故我 们 可 以 应 用 多 元 线性 回归 分 析 中 偏 检验 的 思想 . 第 一 个 式 子 中 的 估 
计 $i PRY re 的 间隔 为 1 的 样本 偏 自 相关 函数 ; 第 二 个 式 子 中 的 估计 Bz 称 为 ri 
的 间隔 为 2 的 样本 偏 自 相 关 函 数 ; 第 三 个 式 子 中 的 估计 B33 RA re 的 间隔 为 3 的 
样本 偏 自 相 关 函 数 ; 依 此 类 推 . 

从 定义 可 以 看 出 , 间隔 为 2 的 样本 偏 自 相关 函数 doo 所 表示 的 是 : 在 AR) 
模型 r, = o+ oiri +e 基础 上 添加 的 7._2 对 re 的 贡献 ; $3.3 表示 的 是 在 AR(2) 
模型 上 添加 的 7,_s 对 的 re 贡献 ; 如 此 等 等 . 因此 , 对 一 个 AR(p) 模型 , 间隔 为 bp 的 
样本 偏 自 相关 函数 不 应 为 零 , 而 对 所 有 jp. $;; 应 接近 于 零 . 我 们 利用 这 一 性 质 
来 决定 阶 p. 对 于 平稳 高 斯 AR(p) 模型 , 可 以 证 明 其 样本 偏 白 相关 函数 (PACF) 有 
如 下 性 质 : 

。 当 样本 容量 T 趋 于 无 穷 时 , pp KAF op; 

。 XE l >p, gi 收敛 于 零 ; 

。 对 1 > p, Bui 的 渐 近 方差 为 z 
这 些 结果 表明 , AR(p) 序列 的 样本 偏 自 相关 函数 是 p 步 截 尾 的 . 

作为 例子 , 考虑 从 1926 年 1 月 到 1997 年 12 月 的 CRSP 价值 加 权 指 数 月 简单 
收益 率 . 表 2-1 给 出 了 这 个 序列 的 样本 自 相关 函数 在 前 10 个 间隔 上 的 值 . T=864, 
该 样本 偏 自 相关 函数 的 渐 近 标准 差 大 约 为 0.03. 从 而 , 在 596 的 显著 水 平 下 , 我 们 
给 数据 识别 一 个 AR(3) 模型 或 AR(5) 模型 (也 就 是 p=3 或 5). 
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表 2-1 从 1926 年 1 月 到 1997 年 12 月 的 CRSP 价值 加 权 指 数 月 
简单 收益 率 的 样本 PACF 和 AIC 
1 2 c 


p 3 4 5 
PACF 0.11 —0.02 —0.12 0.04 0.07 
AIC 一 5.807 一 5.805 —5.817 —5.816 —5.819 
p 6 7 m 9 10 
PACF —0.06 0.02 0.06 0.06 —0.01 
AIC —5.821 —5.819 —5.820 —5.821 一 5.81R 


作为 另外 一 个 例子 , 图 2-6 给 出 了 例 2.1 GNP 增长 率 的 PACE. 图 中 的 虚线 
表示 的 是 大 约 为 两 个 标准 误差 的 上 下 限 土 (2/V176). 此 图 表明 AR(3) 模型 适合 该 
数据 , 因为 样本 PACF 在 前 三 个 间隔 点 上 比较 大 . 


2 4 6 8 10 12 
间隔 
图 2-6 从 1947 年 第 2 季度 到 1991 年 第 1 季度 的 美国 实际 GNP 季度 增长 率 的 
样本 偏 自 相关 系数 .虚线 给 出 了 置信 水 平 为 95% 的 置信 区 间 的 近似 
信息 准则 


有 几 种 信息 准则 可 用 来 决定 AR 过 程 的 阶 p, 它们 都 基于 似 然 函 数 . 例如 , = 
名 的 Akaike 信息 准则 (AIC)(Akaike, 1973) 定义 如 下 : 


AIC — - In( 似 然 函数 的 最 大 值 ) + 子 (参数 的 个 数 )， (2.16) 
其 中 T 是 样本 容量 . 对 高 斯 AR(1) 模型 , AIC 简化 为 
AIC(l) = In(82) 十 m 


其 中 而 是 of 的 最 大 似 然 估 计 , o2 是 a, 的 方差 , T 是 样本 容量 (1 (1.18) X). 
(2.16) 式 中 的 AIC 的 第 一 项 度量 的 是 AR(1) 模型 对 数据 的 拟 合 优 度 , 而 第 二 项 称 
为 准则 中 的 悉 罚 图 数 , 因为 它 几 参数 的 个 数 来 惩罚 所 用 的 模型 . 不 同 的 惩罚 函数 导 
致 了 不 同 的 信息 准则 . 
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另外 一 个 常用 的 信息 准则 函数 为 (Schwarz) 贝 叶 斯 信息 准则 (BIC). 对 高 斯 
AR() 模型 , 该 准则 为 
BIC(£) = In(57)+ a 
对 每 个 参数 的 惩罚 在 AIC 中 为 2, 而 在 BIC 中 为 In(T). 因此 , 当 样本 容量 适度 或 
较 大 时 , BIC 倾向 于 选择 一 个 低 阶 的 AR 模型， 


选择 规则 


在 实际 应 用 中 , 为 了 利用 AIC 来 选择 一 个 AR 模型 , 要 计算 AIC), 对 1!=0,1， 
2... P, 其 中 尸 为 事先 给 定 的 一 个 正 整 数 , 然后 选择 阶 Kk, 使 AIC 达 最 小 值 . 
表 2-1 也 给 出 了 p=1,2,--- ,10 时 AIC 的 值 . 这 些 AIC 的 值 都 很 靠近 , “4 p — 6 
Al p = 9 时 达 最 小 值 —5.821, 故 按 准 则 应 选 AR(6) 模型 . 这 个 例子 说 明 不 同 的 方 
法 可 能 会 得 出 阶 p 的 不 同 选择 . 在 实际 应 用 中 , 还 没有 证 据 表明 一 种 方法 就 一 定 比 
另外 一 种 方法 好 . 对 给 定 的 时 间 序 列 数据 选择 一 个 AR 模型 时 , 还 有 两 种 因素 起 着 
重要 作用 , 即 所 研究 问题 的 具体 信息 和 模型 的 简单 性 . 
再 次 考虑 例 2.1 中 美国 季度 实际 GNP 增长 率 序列 , S-Plus 中 Finmetrics 模块 
给 出 的 AIC 识别 了 一 个 AR(3) 模型 . 这 里 , 准则 值 已 经 经 过 调整 以 使 得 AIC 的 最 
小 值 为 0. 
> gnp-scan(file-'q-gnp4791.txt') 
> ord=ar (gnp) 
> ord$aic 
[1] 27.569 2.608 1.590 0.000 0.273 2.203 
[7] 4.017 5.992 5.826 7.523 7.822 9.581 
[13] 7.398 8.943 10.912 12.895 14.298 16.279 
[19] 18.100 20.050 22.007 23.436 25.378 
> ordSorder 
[1] 3 


参数 估计 


对 十 由 (2.9) 式 给 出 的 一 个 具体 的 AR(p) 模型 , 我 们 常用 条 件 最 小 二 乘法 来 估 
WHER. 条 件 最 小 二 乘 是 从 第 pH 个 观测 值 开始 的 . 具体 地 说 , 在 给 定 前 p 个 观 
测 值 的 前 提 下 , 我 们 有 


Te = do Hire + +++ pri p + at, sy 


上 式 为 多 元 线性 回归 的 形式 , 其 中 的 参数 可 用 最 小 二 乘法 估计 . dd 内 为 办 的 估计 ， 
所 拟 合 的 模型 为 

ft = Êo 7 iTi amissae 4 QpTt—p 
对 应 的 残 差 为 


Ge = fi 一 T. 
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BK (à) 为 残 差 序 列 , 并 得 到 
ME Sasi 

7a — T—9p—1 
如 果 用 条 件 最 大 似 然 方法 , $; 的 估计 保持 不 变 , 而 o2 的 估计 变 为 o2 —32x(r— 
2p — 1)/(T —p). 作为 说 明 , 考虑 给 表 2-1 所 示 的 价值 加 权 指 数 的 月 简单 收益 率 建 立 
一 个 AR(3) 模型 , 所 拟 合 的 模型 为 


re = 0.010 3 | 0.104r,.., — 0.010r; 2 — 0.120r,.3-F à; Ga = 0.054. 


系数 的 标准 误差 依次 分 别 是 0.002, 0.034, 0.034 和 0.034. 除了 延迟 为 2 的 系数 外 ， 
其 他 参数 在 1% 的 水 平 下 都 是 显著 的 . 

对 这 个 例子 , 所 建 AR 模型 的 系数 都 很 小 , 表明 所 考虑 序列 的 序列 相关 性 较 弱 ， 
即使 这 种 相关 性 在 1% 水 平 下 是 统计 显著 的 . 所 拟 合 的 模型 中 bo 的 显著 性 意味 着 
这 个 序列 的 期 望 平均 收益 率 是 正 的 . 事实 上 , A=0.010 3/(1—0.104--0.010--0.120)—0.01, 
是 一 个 很 小 的 正 数 , 但 它 有 重要 的 长 期 意义 . 这 意味 着 所 考虑 的 指数 的 长 期 收益 率 
是 相当 大 的 . 利用 第 1 章 中 定义 的 多 周期 简单 收益 率 , 这 时 平均 年 度 简单 毛 收益 内 
是 (TT) (1 + Ri)? — 1 = 0.105 3. 换 句 话说 , 从 1926 年 到 1997 年 间 , CRSP fft 
值 加 权 指 数 的 月 收益 大 约 平均 每 年 增长 10.53%. 此 数据 支持 这 样 一 个 观点 : 长 期 
来 看 , 股票 市 场 的 表现 令 人 乐观 . 在 1926 年 初 1 美元 的 投资 , 到 1997 年 底 的 价值 
KA 1350 美元 . 


模型 的 检验 


我 们 必须 仔细 地 检查 所 拟 合 的 模型 以 防止 可 能 存在 的 模型 的 非 充分 性 ， 如果 
模型 是 充分 的 , 则 其 残 差 序列 应 是 白 噪 声 ， 残 差 的 样本 自 相 关 函 数 和 (2.3) RE 
义 的 Ljung-Box 统计 量 可 用 来 检验 a, 与 一 个 白 噪声 的 接近 程度 . 对 AR(p) 模型 ， 
Ljung-Box 统计 量 Q(m) 渐 近 服从 自由 度 为 m 一 g 的 x? 分 布 , 其 中 g 是 所 用 模型 
中 AR 系数 的 个 数 . 这 里 对 自由 度 进行 了 修正 , 是 因为 从 拟 合 AR(0) 模型 到 拟 合 
AR(p) 模型 , 对 残 差 a, 的 限制 个 数 增加 了 . 如 果 所 拟 合 的 模型 经 验证 是 不 充分 的 ， 
那么 就 需要 对 它 进 行 草 新 改进 . 例如 , 如 果 某 些 被 估 AR 系数 与 0 没有 显著 差别 
则 我 们 应 该 去 掉 这 些 不 显著 的 参数 , 以 此 对 模型 进行 简化 . 如 果 残 差 显示 出 额外 的 
序列 相关 性 , 则 应 考虑 到 这 些 相 关系 数 而 对 模型 进行 扩展 . 

现在 考虑 对 价值 加 权 指 数 的 月 简单 收益 率 拟 合 AR(3) 模型 所 得 的 残 差 序 列 . 
可 算得 Q(12)=16.9, 并 且 基 于 自由 度 为 9 的 x? 分 布 的 p 值 为 0.05. 这 样 , 在 5% 
的 水 平 下 , 前 12 个 间隔 无 序列 相关 性 的 原 假设 几乎 不 能 拒绝 .然而 , 延迟 为 2 的 
AR 系数 在 5% 的 水 平 下 是 不 显著 的 , 我 们 可 以 将 模型 改进 为 


re = 0.010 2+0.1037t_1—0.122ri_s++a, 64 = 0.054 2, 


2.4 简单 的 自 回归 模型 ”39 


其 中 所 有 的 估计 在 5% 的 水 平 下 都 是 显著 的 . 残 差 序列 给 出 Q(12)=17.2, 其 p 值 为 
0.070( 基 于 x2, 分 布 ). 该 模型 对 数据 的 动态 线性 依赖 性 的 建 模 是 充分 的 . 


SCA 演示 


给 出 了 输出 结果 . 


input vw. file 'm-vw2697.txt' 


tsm ml. model (1,2,3)vw=c+noise. $ Model specification 


estim ml. hold resi(ri1). 


SUMMARY FOR UNIVARIATE TIME SERIES MODEL M1 


站 


VARIABLE TYPE OF ORIGINAL DIFFERENCING 
VARIABLE OR CENTERED 


VW RANDOM ORIGINAL NONE 
PAR. VAR. NUM./ FACTOR ORDER CONS- VALUE STD T 
LABEL NAME  DENOM. TRAINT ERROR VALUE 
x © CNST 1 0 NONE .0103 .0019 5.34 
2 VW AR n 1 NONE .1041 .0338 3.08 
3 VW AR 1 2 NONE -.0103 .0340 -.30 
4 VW AR 1 3 NONE -.1204 .0338 -3.56 
EFFECTIVE NUMBER OF OBSERVATIONS . . 861 
RSBOURRUP à weg hb o es BOR 9: 0.025 
RESIDUAL STANDARD ERROR. . . . . . . 0.541903E-01 
acf rl. maxl 12. 
NAME (OF “THE SERIES >o 6x9 £9 6x R1 
TIME PERIOD ANAUYZED ... s ie e coo; 4 TO 864 
MEAN OF THE (DIFFERENCED) SERIES . . . 0.0000 
STANDARD DEVIATION OF THE SERIES . . . 0.0542 
T-VALUE OF MEAN (AGAINST ZERO)... . 0.0000 


AUTOCORRELATIONS 


l— T2 Ol .03 -.01. .03 .09:-.05: ..04. DS .08 -.08' -.03; .01 
STR: 003: 03 .03. .03 .03 ha .03  .03  .03 .03 Ud ou 
Q £M. s AO L.0 77.49. S63) S23 10.6 15.8 15:8 16.8' 16.9 


p=l-cdfc(16.9,9) € Compute p value. 


print p 


.050 
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S-Plus 演示 
给 出 了 输出 结果 , > 表示 DOS 提示 符 . 


> vw=sean (file='m-vw2697.txt’ ) 
> ar3=OLS (vw~ar (3) ) 
> summary (ar3) 


Call: 
OLS(formula = vw ~ ar(3)) 
Residuals: 
Min 1Q Median 3Q Max 


-0.2845 -0.0259 0.0025 0.0288 0.3705 


Coefficients: 
Value Std. Error t value Pr(»|t|) 
(Intercept) 0.0103 0.0019 5.3314 0.0000 
lagl 0.1041 0.0339 3.0716 0.0022 
lag2 -0.0103 0.0341 -0.3016 0.7630 
lag3 -0.1204 0.0339 3.5538 0.0004 


Regression Diagnostics: 

R-Squared 0.0258 
Adjusted R-Squared 0.0224 
Durbin-Watson Stat 1.9890 
> autocorTest (ar3$residuals, lag=12) 
Test for Autccorrelation: Ljung-Box 
Null Hypothesis: no autocorrelation 


Test Statistics: 


Test Stat 16.9367 
p-value 0.1520 % S-Plus uses 12 degrees of freedom. 


> 1-pchisq(16.9367,9) $ Calculate p-value using 9 df. 
[1] 0.04971652 


2.4.3 WAKE 
衡量 平稳 模型 拟 合 优 度 的 一 个 常用 的 统计 量 是 R? 统计 量 , 其 定义 为 


“ 残 差 的 平方 和 
总 的 平方 和 


对 于 平稳 AR(p) 模型 , 假设 有 TAWA frtt= 1 VT), 则 R? 变 为 


Y à ^ 
2e emm a? 


T Am 
veel — f) 


R? —1 


R? == 
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其 中 ”+= È x ^) /(T—p). 容易 证 明 , 0 < R? < 1. 特别 地 , R? BK, 表示 模型 


对 数据 拟 合 地 越 好 然而 该 结论 只 对 平稳 时 间 序 列 成 立 . 对 于 本 章 后 面 将 要 讨论 的 
单位 根 非 平稳 序列 , 当 样本 容量 趋 于 无 穷 时 , 无 论 r 实际 服从 一 个 怎样 的 模型 , 对 
其 拟 合 一 个 AR(1) 模型 时 , R? 均 趋 于 1. 

众所周知 , 对 于 一 个 给 定 的 数据 集 , n? 是 所 用 参数 个 数 的 非 降 函数 . 为 了 克服 
该 缺点 , 建议 用 调整 后 的 R?, 它 定义 为 


其 中 a 是 ri 的 样本 方差 . 这 个 新 的 衡量 方法 将 拟 合 模型 中 用 到 的 参数 个 数 也 考 
BEN. 然而 , 其 取 值 仍然 在 0 和 1 之 间 . 


2.4.4 ”预测 

预测 是 时 间 序 列 分 析 中 的 一 个 重要 应 用 . 对 (2.9) 式 中 的 AR(p) 序列 , 假定 我 
们 在 时 间 指 标 为 h 的 点 上 , A raye 1 >1. 时 间 指 标 h 称 为 预测 原点 (forecast 
origin), 正 整 数 ! 称 为 预测 步 长 (forecast horizon). 设 Pall) 为 ras. 的 最 小 均 方 误 
差 预测 , ry 为 在 预测 原点 h 所 得 到 的 信息 集合 . 则 我 们 选择 fell) 作为 预测 , 使 得 
Fk) 满足 

E{[ra41—7#a(l)]?|Fa} < min E[(rn+t— g)^| FA]; 

其 中 9 Æ h WA) (包括 h 时 刻 ) 所 得 到 的 信息 的 函数 , BU y 是 及 的 函数 . 我 们 称 
Pall) 为 re 的 以 为 预测 原点 的 向 前 1 步 预测 . 

向 前 1 步 预测 

由 AR(p) 模型 , 我 们 有 


Tait — Q0 FOITk 二 二 Tht 二 Ga+1- 


在 均 方 损 失 函 数 下 , 给 定 Fh = {rnrn horn 的 点 预测 为 条 件 期 望 


fy (1) = E(rnrilFh) = po + oe t 


i=] 
对 应 的 预测 误差 为 
e&(1) = fh41 — f (1) — Gay. 
从 而 , 向 前 1 步 预测 误差 的 方差 为 Var[es(1)| = Var(an41) = 02. € a. 服从 正 态 分 
dg, W rapi 的 9596 的 向 前 1 步 区 间 预 测 是 六 (1) 士 1.96 x og. 对 (2.4) 式 给 出 的 
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线性 模型 , at+i 也 是 以 t 为 预测 原点 的 向 前 1 步 预测 误差 . 在 计量 经 济 的 文献 中 、 
ari KA t+ 1 时 刻 序列 的 扰动 ， 

在 实际 应 用 中 , 经 常用 被 估 参 数 来 计算 点 预测 和 区 间 预 测 . 这 导致 了 条 件 预 测 . 
因为 这 样 的 预测 没有 考虑 参数 估计 中 的 不 确定 性 . 理论 上 , 我 们 可 以 在 预测 中 考虑 
参数 的 不 确定 性 , 但 其 复杂 性 将 大 大 增加 ， 当 在 估计 中 使 用 的 样本 容量 充分 大 时 . 
条 件 预 测 与 无 条 件 预 测 是 接近 的 . 

向 前 2 步 预 测 

下 面 考虑 以 h 为 预测 原点 对 raez 的 预测 . 由 AR) BUS, 我 们 有 


Th42 = bo + PiTngs + +++ + Óprh 42 p + an+2. 
取 条 件 期 望 , 我 们 有 
Fn(2) = E(rn.2|Fh) — bo + Wifn(1) + darn +--+ Øprh+2-p 
对 应 的 预测 误差 为 
€n(2) = rate — r&(2) = dilrng1 — Fa(1)] + an2 = an42 + $1541. 


预测 误差 的 方差 为 Varlen(2)] = (1+ 91)o2. rh4z 的 区 间 预 测 可 以 用 与 raai 相同 
的 方法 计算 出 来 . 值得 注意 的 是 Var[en (2)] > Var[e, (1)], 这 意味 着 预测 步 长 的 增加 
会 使 预测 中 的 不 确定 性 也 增加 ， 这 与 通常 的 感觉 是 一 致 的 : 对 线性 序列 来 说 , 我 们 
在 hh 时刻 对 ra 的 把 握 不 如 对 Thai 的 把 握 大 . 


向 前 多 步 预测 
一 般 地 , 我 们 有 


Th--£ = Got Oirn+e—-1 + +++ Óprh pd An+e. 


基于 均 方 损失 函数 最 小 化 而 得 到 的 向 前 REP, ORE rj 的 条 
件 期 望 , 可 以 由 下 式 得 到 


p 
feet — po +Y ditn(€ i), 

tl 
其 中 , $ i «o 时 , 约定 Panli) = nhau. 这 个 预测 可 用 让 (让 ,i = 1,2,… ,1 一 1 递 推 计算 
出 来 . 向 前 1 步 预测 的 误差 是 en (0) — rapt — a(l). 可 以 证 明 : 对 平稳 AR(p) 序列 ， 
Ml 一 十 ce 时 , FL) 收敛 于 Elri). 也 就 是 说 , 对 这 样 的 序列 , 长 期 的 点 预测 趋 于 
无 条 件 均值 . 在 金融 文献 中 , 这 种 性 质 称 为 均值 回转 (mean reversion). AR(1) 模型 ， 
均值 回转 的 速度 由 半衰期 (halflife) 来 衡量 , 其 中 半衰期 定义 为 大 = ln(0.5/| 内 上), 预 
测 误差 的 方差 则 趋 于 r 的 无 条 件 方差 . 
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de 2-2 包含 了 对 价值 加 权 指数 月 简单 收益 率 的 向 前 1 步 至 6 步 的 预测 结果 和 
相应 的 预测 误差 的 标准 差 : 以 858 为 预测 原点 , 利用 前 858 个 观察 值 重新 估计 的 
AR(3) 模型 . 实际 的 收益 率 也 已 给 出 . 由 于 序列 的 弱 自 相关 性 , 预测 值 和 预测 误差 
的 标准 差 将 很 快 收敛 到 样本 均值 和 数据 的 标准 差 . 前 858 个 观察 值 的 样 木 均值 和 
标准 差分 别 为 0.009 8 和 0.055 0. 


$ 2-2 对 CRSP 价值 加 权 指数 月 简单 收益 率 用 AR(3) 模型 的 
向 前 多 步 预测 的 结果 , 预测 原点 为 858 


步 数 1 2 3 4 5 6 

预测 值 0.008 8 0.002 0 0.005 0 0.009 7 0.010 9 0.010 6 
标准 误差 0.054 2 0.054 6 0.054 6 0.055 0 0.055 0 0.055 0 
实际 值 0.076 2 —D.036 5 0.058 0 —0.034 1 0.031 1 0.018 3 


图 2-7 所 示 的 是 对 价值 加 权 指 数 月 对 数 收 益 率 的 超出 样本 范围 之 外 的 向 前 1 
步 至 o 步 的 预测 值 和 它们 的 两 个 标准 差 的 上 下 限 . 这 些 预 测 是 由 下 述 AR(5) 模型 
给 出 的 : 


re = 0.007 5 + 0.1037, 十 0.0027 2 一 0.1147 3 十 0.03274 4 十 0.08471 5 + ät, 


其 中 ôa = 0.054, 该 模型 是 由 前 面 所 讨论 的 建 模 程序 建立 的 . 在 这 个 例子 中 , 预测 
值 很 接近 实际 值 . 所 有 实际 值 都 在 95% 的 预测 区 间 内 . 


852 854 856 858 860 862 864 
A 
图 27 CRSP 价值 加 权 指 数 月 对 数 收 益 率 的 向 前 1 步 至 6 步 的 预测 图 . 预测 原点 为 £—858, 
预测 值 用 空心 点 “。” 表 示 , 实际 值 用 实 点 “. ”表示 . 两 条 虚线 表示 预测 值 的 两 个 标 
准 误差 的 上 下 限 


2.5 ”简单 滑动 平均 模型 


本 节 将 讨论 男 一 类 简单 模型 , 它们 在 金融 收益 率 建 模 中 也 很 有 用 . 这 类 模型 叫 
做 滑动 平均 模型 (moving-average, MA). 引进 MA 模型 有 几 种 方式 : 一 种 方式 是 把 
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它 当 作 白 噪声 序列 的 简单 推广 ; 另 一 种 方式 是 把 它 看 成 参数 受 某 种 限制 的 无 穷 阶 
AR 模型 . 本 节 采 用 第 二 种 方式 . 如 在 第 5 章 将 要 讨论 的 , 在 股票 交易 中 , LEN 
间 的 跳动 会 在 收益 率 序列 中 引出 一 个 MA(1) 结构 . 
除了 简单 性 之 外 , 没有 特别 的 理由 假定 AR 模型 的 阶 是 有 限 的 . 我 们 可 以 考虑 
(至 少 在 理论 上 ) 无 穷 阶 AR 模型 为 
Tt = Qo PITti 二 Bart_2 二 -十 a. 


然而 , 这 样 的 AR 模型 是 没有 实际 意义 的 , 因为 它 有 无 穷 多 个 参数 .使 这 样 的 模型 
有 实际 用 途 的 一 个 方式 是 假定 系数 pi 满足 某 种 限制 , 使 得 它们 可 由 有 限 个 参数 决 
定 . 这 种 想法 的 一 个 特殊 情形 为 


Tt = Go — ni — Bry — Ore gases (2.17) 


其 中 系数 只 依赖 于 单个 参数 01, 6; = -0j,i 21. 要 使 (2.17) 中 的 模型 是 平稳 的 ， 01 

必须 是 绝对 值 小 于 1 的 , 否则 0: 和 序列 本 身 将 发 散 . 因为 [ði] < 1, TC i — oc 时 ， 

AO, 0. 从 而 mi 对 ri 的 贡献 随 i 的 增加 以 指数 速度 衰减 这 一 点 是 合理 的 ， 

因为 平稳 序列 re 对 它 的 延迟 值 re 如 果 有 依赖 的 话 , 这 种 依赖 程度 应 随时 间 衰 减 . 
(2.17) 中 的 模型 能 写成 一 个 相当 紧凑 的 形式 , 为 此 , 我 们 把 模型 先 写 成 


Tt + Oiri- Ofrp_g +++: = 09 + ay. (2.18) 
对 r，1 的 模型 为 
ret + Or 3 十 的 7 3 十 .一 各 十 ai 4. (2.19) 
在 (2.19) 式 两 边 乘 以 1, 然后 减 去 (2.18) 式 , 得 到 
rt = Go(1 — 61) + a, — 01a, 1, 


此 式 说 明 : 除去 常数 项 外 , r 是 两 个 扰动 w 和 aa 的 加 权 平 均 . 因此 , 此 模型 称 
为 1 Bt MA 模型 , 简称 为 MA(1) BUS. MA(1) 模型 的 一 般 形 式 为 


Ti = Co +a — Orar- 或 ri — co 4- (1 — 61 B)a;, (2.20) 
其 中 co 是 一 个 常数 , (a) 是 一 个 白 噪声 序列 . 类 似 地 , MA (2) 模型 的 形式 为 
ri = Co +a — 0104-1 — 0384. 3, (2.21) 
MA(q) 模型 为 


Te = C0 + ae — 0104 1 — 5-4 — 04044. (2.22) 


8X re =eo+(1 —D1B —-.. —0,B*)a, 其 中 q»0. 


2.5 ”简单 滑动 平均 模型 ”45 


2.5.1 MA 模型 的 性 质 


我 们 仍然 只 讨论 简单 的 MAO) 和 MA(2) HUS. MA (4) 模型 的 结果 可 用 相同 
的 方法 得 到 . 


平稳 性 


MA 模型 总 是 弱 平稳 的 , 因为 它们 是 白 噪声 序列 的 有 限 线 性 组 合 , 其 前 两 阶 失 是 不 
随时 间 变 化 的 . 例如 , 考虑 (2.20) 式 给 出 的 MA(1) 模型 . 对 这 个 模型 两 端 取 期 望 可 
得 Elri) = co, 这 不 随时 间 变 化 . 在 (2.20) 式 两 端 取 方 差 , 我 们 有 


Var(ri) = o2 + 6107 = (1+ Of)o%, 


这 里 我 们 用 到 a, 与 a, 1, 的 不 相关 性 . Var(r;) 也 不 随时 间 变 化 . 这 些 讨 论 对 一 般 
的 MA(g) 模型 也 适用 , 因此 我 们 得 到 两 个 一 般 性 质 : 第 一 , MA 模型 的 常数 项 就 是 
序列 的 均值 [也 即 Elri) = col; 第 二 , MA(q) 模型 的 方差 为 


Var(rt) = (1 + OF + 05 + +++ + 02)07. 
PELES Sk 
为 简单 起 见 , 假定 MA(1) 模型 中 co = 0. 对 两 端 乘 以 r-n 我 们 有 


Ti (Tt = Tritt — O3T4 6044. 


HU es, 得 到 
yi = —01c2, Hl > 1 时 y= 0 


利用 上 述 结果 , 并 注意 到 Var(r,) = (1 + 07 )0?, 我 们 有 


pa-—l, f a=0, 其 中 121 


= 
~ 146?’ 
因此 , 对 MA(1) 模型 , 间隔 为 1 的 ACE 不 为 0, 但 所 有 间隔 大 于 1 的 ACF 都 是 0. 
换言之 , MA(1) 模型 的 ACF 在 间隔 为 1 以 后 是 截 尾 的 . 对 (2.21) 式 给 出 的 MA(2) 
模型 , 自 相 关系 数 是 


ER —04 + 04105 Ad — (a 
sl " Te eR’ 


这 时 , 在 间隔 为 2 UEM. 这 个 性 质 可 推广 到 其 他 MA 模型 . 对 MA(g) 模型 , 其 


ACF 在 间隔 为 q 时 不 为 0, 但 对 1 >q, pi = 0. 因此 , MA(q) 序列 只 与 其 前 gq 个 延 
人 述 值 线性 相关 , 从 而 它 是 一 个 “有 限 记 忆 ” 的 模型 . 


a=0, KH I>2. 
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ye p 
KEHÄ MA(1) 模型 改写 为 a, = T; 4- biai, 重复 迭代 可 以 得 到 


at = Tt + O44 + 027 2 T Oris qus , 


该 等 式 表 明 当 前 的 扰动 a, 是 现在 和 过 去 收益 率 序 列 的 线性 组 合 . 从 直观 上 看 , B 
着 j 的 增加 01 应 该 趋 于 零 , 因为 遥远 的 过 去 收益 率 对 当前 的 扰动 应 该 几乎 没有 影 
Me). 因此 , 要 使 MA(1) 模型 看 起 来 是 合理 的 , 我 们 应 该 要 求 |91| < 1. 这 样 的 MA(1) 
BA PR Ay YA. 如 果 19, | = 1, 则 MA(1) 模型 是 不 可 逆 的 . 对 于 可 道 性 的 进一步 
讨论 可 参见 本 书 2.6.5 H. 


2.5.2 ”识别 MA 的 阶 


自 相 关 函 数 是 识别 一 个 MA 模型 的 阶 的 有 用 工具 . 如 果 时 间 序 列 v, 具有 自 相 
RAŽ p, 车 Pq #9, 但 对 1 > qA pi = 0, JU] 服从 一 个 MA(q) 模型 . 

图 2-8 所 示 的 是 CRSP 等 权重 指数 (equal-weighted index) 从 1926 42 1 H 
到 1997 年 12 月 的 月 简单 收益 率 的 时 间 图 和 样本 自 相关 函数 图 . 在 样本 自 相 关 函 
数 图 中 有 两 条 虚线 , 它们 是 两 个 标准 误差 的 上 、 下 限 . 可 见 , 该 序列 的 自 相关 系数 在 
间隔 为 1, 3, 9 时 显著 . 对 更 大 的 间隔 也 有 稍 显著 的 , 但 在 这 里 我 们 不 作 考虑 . 基于 
样本 自 相 关 函 数 , 我 们 给 该 序列 建立 下 面 的 MA(9) 模型 


Te = Co + ût 一 01a, 4 — 03a,.3 一 Qoat_o. 


注意 到 , 与 样本 PACF 不 同 , 样本 ACE 提供 了 模型 非 零 MA 延迟 项 的 信息 . 


(a) 月 简单 收益 率 
1940 1960 1980 2000 
(b) 样本 ACF 


图 2-8 CRSP 等 权重 指数 从 1926 年 1 月 到 1997 年 12 月 的 月 简单 收益 率 的 
时 间 图 和 样本 自 相 关 函 数 图 


2.5 简单 滑动 平均 模型 AT 


2.5.3 {hit 


估计 MA 模型 通常 用 最 大 似 然 法 ， 有 两 种 方法 求 MA 模型 的 似 然 函 数 . 第 
一 种 方法 是 假设 初始 的 “ 拢 动 *( 即 au t < 0) 都 是 0, 这 样 由 ay = r — co, az = 
rm 一 co 十 gal, ..., 可 递 推 得 到 计算 似 然 函 数 所 需要 的 “扰动 ". 这 种 方法 称 为 条 件 
似 然 法 , 所 得 的 估计 是 条 件 最 大 似 然 估 计 . 第 二 种 方法 是 把 初始 “扰动 ” ur, (t < 0) 
当 作 模 型 的 附加 参数 与 其 他 参数 一 起 估计 出 来 , 这 种 方法 称 为 精确 似 然 法 . 精确 似 
然 估 计 优 于 条 件 似 然 估 计 , 尤其 是 当 MA 模型 接近 于 不 可 逆 时 . 然而 , 精确 似 然 估 
计 的 计算 会 更 复杂 - 些 . 如 果 样 本 量 较 大 , 这 两 种 似 然 估 计 是 接近 的 . 关于 MA BE 
型 精确 似 然 估计 和 条 件 似 然 估计 的 有 关 细 节 方面 的 讨论 , 读者 可 参阅 Box , Jenkins 
和 Reinsel(1994) 的 书 或 本 书 第 8 F. 

作为 例子 , 我 们 来 考虑 CRSP 等 权重 指数 的 月 简单 收益 率 序列 , 建立 一 个 MA(9) 
模型 . 用 条 件 最 大 似 然 法 拟 合 的 模型 为 


re = 0.013 十 at 十 0.181a 1 —0.121a, 3 4-0.122a, 9, a = 0.072 4, (2.23) 


其 中 系数 估计 的 标准 误差 分 别 为 0.003 0, 0.032, 0.032 和 0.032. RIK) Ljung-Box 
统计 量 为 Q (12) = 15.0, 基于 自由 度 为 9 的 x? 分 布 的 pb 值 为 0.091. 看 起 来 , 模型 
对 于 数据 线性 动态 依赖 关系 的 刻画 是 充分 的 . 用 精确 最 大 似 然 法 拟 合 的 模型 为 


T, = 0.013 + ay + 0.183a,.; — 0.1202, 3 + 0.123a¢_9, Gq = 0.072 4, (2.24) 


其 中 各 估计 的 标准 误差 为 0.003, 0.032, 0.032 和 0.032. 残 差 的 Ljung-Box 统计 量 为 
Q (12) = 15.2, p 值 为 0.086. 所 拟 合 的 模型 也 是 充分 的 . 比较 (2.23) 和 (2.24), 可 见 ， 
对 这 样 个 具体 例子 来 说 , 条 件 似 然 法 和 精确 似 然 法 的 差别 是 可 以 忽略 的 . 
2.5.4 用 MA 模型 预测 

MA 模型 的 预测 很 容易 做 . 因为 模型 有 具有 有 限 记忆 性 , 它 的 点 预测 就 会 很 快 达 
到 序列 的 均值 . 为 了 说 明 这 一 点 : 设 预 测 原点 为 h, Fa 为 在 h 时 刻 所 能 得 到 的 信息 
集合 . 对 MA(1) 过 程 的 向 前 一 步 预测 , 由 模型 知 


Th41 = Co + ü&44 — Aap. 
取 条 件 期 望 我 们 有 
Fh (1) = E (Thi | Fh) = eg — tan, 
én (1) — Th41 — Fa (1) = anes. 


向 前 一 步 预 测 误差 的 方差 为 Var [es (1)] = 02. 在 实际 中 , a, 这 个 量 可 由 几 个 方式 得 
到 , 例如 可 假定 ao = 0, WA a1 三 人 4 一 co, 而 an 2 St <h UH ag = re cot Orar 
递 推 得 到 . 另外 , 还 可 用 MA(1) 模型 的 AR 表示 来 计算 at( 参 见 2.6.5 节 ). 
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关于 向 前 两 步 预 测 , 由 方程 
Th+2 = čo + Gh--2 一 0 QGh--1. 


我 们 有 
fs (2) = E (rha |FA) = co. 
Eh (2) = r&42 — fn (2) = an» — 61a541. 
预测 误差 的 方差 为 Var[en (2)] = (1 1 02) o2, 这 是 模型 的 方差 , 它 大 于 或 等 于 向 前 
一 步 预测 误差 的 方差 . 上 面 的 结果 表明 MA(1) 的 向 前 两 步 预 测 即 是 模型 的 无 条 件 
均值 , 这 一 点 对 任意 预测 原点 h 都 正确 . 一 般 地 , 部 (1) = 09,02 2. 总 而 言 之 , 对 一 
个 MA(1) 模型 , 以 六 为 预测 原点 的 向 前 一 步 预测 为 co — as, 向 前 多 步 预测 为 模 
型 的 无 条 件 均 值 co. 如 果 我 们 画 出 6 (0) 对 1 变化 的 图 像 , 会 看 到 从 一 步 以 后 预测 
值 成 一 个 水 平 直 线 . 因此 , 对 于 MA (1) 模型 而 言 , 均值 回转 只 需要 一 个 时 间 周 期 . 
类 似 地 , 对 MA(2) 模型 , 我 们 有 


That = Co + G&441 — agi i — bahita, 


由 此 得 到 


Fa (1) — co — hian — 02a, 1. 
Tn (2) =o = Pra,, 
Th (L) = Co, l 2-2. 


AX FF, MA (2) 模型 的 向 前 两 步 以 后 的 预测 即 达到 序列 的 均值 , 两 步 以 后 预测 误差 的 
方差 也 是 序列 的 方差 . 一 般 地 , 对 一 个 MA(g) 模型 , 向 前 q 步 以 后 的 预测 就 达到 了 
模型 的 均值 . 

表 2-3 给 出 的 是 (2.23) 式 中 对 等 权重 指数 的 月 简单 收益 率 建立 的 MA(9) 的 一 
些 预测 值 , 预测 原点 为 h = 926(2003 年 2 H). 序列 的 前 926 个 观察 值 的 样本 均值 
和 样本 标准 差分 别 是 0.012 6 和 0.075 1. 正如 所 料 , 该 表 说 明 : (a) 向 前 10 步 预测 
值 即 为 样本 均值 ; (b) 当 预 测 步 数 增加 时 预测 误差 的 标准 差 赵 于 序列 的 标准 差 . 


* 2-3 CRSP 等 权重 指数 月 简单 收益 率 拟 合 MA(9) 模型 时 的 预测 表现 * 


you 1 2 3 4 5 

预测 值 0.014 0 —0.005 0 0.015 8 —0.000 8 0.017 1 
dott x 0.072 6 0.073 7 0.073 7 0.074 3 0.074 3 
实际 值 0.009 7 0.098 3 0.133 0 0.049 6 0.061 7 
步 数 6 7 8 9 10 

项 测 值 0.025 7 0.000 9 0.014 9 0.009 9 0.012 6 
标准 差 0.074 3 0.074 3 0.074 3 0.074 3 0.074 8 
实际 值 0.047 5 0.025 2 0.081 0 0.038 1 0.039 1 


a 预测 原点 为 h= 926, HI 2003 年 2 A, 模型 的 估计 是 用 条 件 最 大 似 然 法 得 到 的 . 
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小 结 
我 们 对 AR 和 MA 模型 进行 一 个 简短 的 总 结 . 木 节 讨 论 了 以 下 一 些 性 质 : 

e X] MA 模型 , ACF( 自 相关 函数 ) 是 定 阶 的 有 力 工具 , 因为 对 MA(g) 序列 , ACF 
是 q 步 截 尾 的 ; 

e 对 AR 模型 , PACF( 偏 自 相 关 函 数 ) 是 定 阶 的 有 力 工 具 , 因为 对 An(p) 过 程 ， 
PACF 是 p 步 截 尾 的 ; 

e MA 序列 总 是 平稳 的 , 而 对 AR 序列 , 当 其 特征 根 的 模 都 小 丁 1 IN, 它 是 平稳 
的 ; 

e 对 一 个 平稳 序列 , 向 前 多 步 预测 收敛 到 序列 的 均值 , 预测 误差 的 方差 收敛 于 序 
歼 的 方差 . 
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在 有 些 应 用 中 , 我 们 需要 高 阶 的 AR 或 MA 模型 才能 充分 地 描述 数据 的 动态 
结构 . 这 样 就 有 很 多 参数 要 估计 , 问题 变 得 繁琐 了 . 为 了 克服 这 个 困难 , 人 们 提出 了 
A BAYS (ARMA) 模型 . 参见 Box, Jenkins 和 Reinsel(1994). 基本 思想 是 
把 AR 和 MA 模型 的 想法 结合 在 一 个 紧凑 的 形式 中 , 使 所 用 参数 的 个 数 保 持 很 小 . 
对 金融 中 的 收益 率 序列 , 直接 用 ARMA 模型 的 机 会 较 少 . 然而 , ARMA 模型 的 概 
念 与 波动 率 建 模 有 密切 关系 . 事实 上 , 广义 自 回归 条 件 异 方差 (GARCH) 模型 就 可 
以 认为 是 对 (a2) 的 ARMA 模型 , 尽管 是 非 标 准 的 . 第 3 章 中 会 详细 讨论 这 一 点 . 
本 节 将 研究 最 简单 的 ARMA(1,1) 模型 . 

称 一 个 时 间 序 列 m 服从 ARMA(1,1) 模型 , 如 果 m 满足 


T; — DITt 1 = Qo + at — 061041, (2.25) 


其 中 {a} 是 白 噪声 序列 . (2.25) 式 的 左边 是 模型 的 AR 部 分 , 右边 是 MA 部 分 , 常 
数 项 为 to. 为 使 这 样 一 个 模型 有 意义 , BOR h 7-01. 否则 , 在 方程 的 两 端 消去 一 个 
AAF, 方程 所 决定 的 过 程 就 变 为 了 一 个 白喉 声 序 列 . 


2.6.1 ARMA(1, 1) 模型 的 性 质 
ARMA(1,1) 模型 的 性 质 是 AR(1) 模型 的 相应 性 质 的 推广 , 只 是 作 - -些小 的 修 
改 来 处 理 MA(1) 部 分 的 影响 . 首先 讨论 平稳 性 条 件 . 在 (2.25) 式 两 端 取 期 望 , 得 到 
E (ri) i OE (ri) = oo 十 E (az) = 06 E (ar—1) à 


因为 对 所 有 的 i, WA E (ai) = 0, 所 以 只 要 序列 是 弱 平 稳 的 , 则 re 的 均值 为 


Qo 
1— 


B) = p= 
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此 结果 和 (2.8) 式 AR(1) 模型 的 结果 完全 一 样 . 
为 简单 起 见 , 假定 如 = 0. 下 面 我 们 考虑 r 的 自 协 方差 函数 . 首先 , 在 模型 两 
端 乘 以 a, 再 取 期 望 , 我 们 有 


E (rra) = E (a?) — 01E (arar) = E (a?) = 03, (2.26) 


把 模型 改写 成 


re = diria + at — 01044, 
在 上 式 两 端 取 方差 , 得 到 
Var (ri) = d Var (re—1) +02 + 0202 — 2610, E (riat 1). 
这 里 用 到 ra 与 a, 不 相关 这 一 事实 . 利用 等 式 (2.26), 我 们 得 到 
Var (re) — %3 Var (re—1) = (1 — 26:61 + 02) c2. 
从 而 , BFW r, 是 弱 平 稳 的 , 则 Var (r) = Var (ria), 且 


1 — 26,6; + 02) c2 
Var (re) = C20 xe. 
1 


因为 方差 是 正 的 , 故 要 求 62 < 1( 也 即 | 办 | <1). 这 又 与 AR(1) 模型 的 平稳 性 条 件 
一 样 了 . 

为 了 得 到 ~ 的 自 协 方差 函数 , 我 们 假定 加 = 0, 并 在 (2.25) RPMI ri, 
得 到 


rerte—t — PITt arit = agg — 6184 4T; 4. 
对 1= 1, 在 上 式 两 端 取 期 望 并 利用 ¢ — 1 时 的 (2.26) 5X, 我 们 有 
^ — bY = —610?, 


其 中 y = Cov (ri, r, 1). 这 个 结果 不 同 于 AR(1) 情形 , 对 AR(1) 模型 有 > — $130 = 
0. 然而 , 对 1 — 2, 取 期 望 后 得 到 


y2 — 911 = 0, 
这 与 AR(1) 情形 FE. 事实 上 , 用 相同 的 方法 可 得 到 


N—-Aavn=1:=—0, 11. (2.27) 
对 于 ACF, 上 述 结果 表明 : 对 平稳 ARMA(1,1) 模型 有 
0102 


pi = 41 — Pi = Oipi-1, 01. 
Yo 
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这 样 , ARMA(1,1) 模型 的 ACE 很 像 AR(1) 模型 的 ACF, 不 同 之 处 仅 在 于 它 的 指 
数 衰 减 是 从 间隔 2 开始 的 . 因此 . ARMA(1,1) 模型 的 ACF 不 能 在 任意 有 限 间 隔 后 
截 尾 . 

现在 来 看 偏 自 相 关 函 数 (PACF). 可 以 证 明 : ARMA(1,1) 模型 的 PACF 也 不 能 
在 有 限 间隔 后 截 尾 . 它 与 MA(1) 模型 的 PACF 表现 很 相似 , 只 是 指数 衰减 从 间隔 
2 开始 , 而 不 是 从 间隔 1 开始 . 

综 上 所 述 , ARMA(1,1) 模型 的 平稳 性 条 件 与 AR(1) 模型 的 相同 , ARMA(1,1) 
模型 的 ACF 与 AR(1) 模型 的 ACF 形式 相似 , 只 是 这 种 形式 从 间隔 2 处 开始 . 


2.6.2 “一般 的 ARMA 模型 
一 般 的 ARMA(p, q) 模型 的 形式 为 


re = Wo 十 3 ori 十 Qt 一 >》 biati, 
t=] =I 

其 中 {a} 是 白 噪 声 序 列 , p 和 4 都 是 非 负 整数 . AR 和 MA 模型 是 ARMA(p, q) 的 

特殊 情形 . 利用 向 后 推移 算 子 , 上 述 模型 可 写成 


(1 — #1 B—---—¢,B?) ri = bo + (1 -0B — = —6,B%) ay. (2.28) 


模型 的 AR 多 项 式 是 1 OB ---— 6,B^, MA EMRE 1—6,B — — 0,Dn. 
我 们 要 求 AR 多 项 式 和 MA 多 项 式 没 有 公 因 子 , 否则 模型 的 阶 (p, q) 会 降低 . 如 
AR 模型 一 样 ，AR 多项式 引进 了 ARMA 模型 的 特征 方程 . 如 果 特 征 方程 所 有 
根 的 绝对 值 都 小 于 1, 则 该 ARMA 模型 是 弱 平 稳 的 . 这 时 , 模型 的 无 条 件 均值 为 
E (rt) = 6o0/ (1— $1 —::- — $$). 

2.6.3 ”识别 ARMA 模型 


在 给 ARMA 模型 定 阶 时 , ACF 和 PACF 都 不 是 很 有 用 的 . Tsay 和 Tiao(1984) 
提出 一 个 新 方法 , 利用 推广 的 自 相 关 函 数 (BACP) 来 确定 ARMA 过 程 的 阶 . EACF 
的 基本 思想 相当 简单 .如果 我 们 能 得 到 ARMA 模型 的 AR 部 分 的 相合 估计 , 则 能 
导出 MA 部 分 . 对 所 导出 的 MA 序列 ,用 ACF 决定 MA 部 分 的 阶 . 

EACF 的 导出 相对 复杂 一 些 , 细节 参见 Tsay 和 Tiao(1984). 但 此 函数 很 容易 
使 用 . EACF 的 结果 可 以 用 一 个 二 维 表格 表示 , 这 个 表 的 行 对 应 于 AR 的 阶 p, 列 对 
应 于 MA 的 阶 q. ARMA(1,1) 模型 的 EACF 的 理论 形式 由 表 2-4 给 出 . 这 个 表 的 主 
要 特征 是 : 它 包 含 由 “0O” 组 成 的 三 角形 , 并 且 这 个 三 角形 左上 角 项 点 位 于 阶 (1,1) 
处 . 我 们 止 是 用 这 样 的 特 和 外 来 识别 一 个 ARMA 过 程 的 阶 . 一 般 地 , 对 ARMA(p, q) 
模型 , 由 “O” 组 成 的 三 角形 的 左上 角 顶 点 位 于 (p, q) Ab. 

作为 例子 , 考虑 3M 公司 股票 从 1946 年 2 月 到 1997 年 12 月 的 月 对 数 收益 率 . 
共有 623 个 观测 值 , 收益 率 序列 和 它 的 样本 自 相 关 函 数 由 图 2-9 所 示 . ACF 图 表明 
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在 5% 的 水 平 下 序列 没有 显著 的 序列 相关 性 . 表 2-5 给 出 了 样本 EACF 的 值 和 对 应 
的 简 表 . 简 表 是 用 如 下 记号 来 构造 的 : 

(1) “x” 表 示 对 应 的 EACF 的 绝对 值 大 于 或 等 于 2/VT, 该 值 是 EACF 渐 近 标 
准 误差 的 两 倍 ; 

(2) “O” 表示 对 应 的 EACEF 的 绝对 值 小 于 2//T. 


# 2-4 ARMA(1,1) 模型 的 EACF 理论 表 , HH “x” REEF, “0” (ORE, 
AY 代表 零 或 者 非 零 , 它 在 识别 阶 (1,1) 时 不 起 任何 作用 


MA 
AB 0 1 2 3 4 5 6 T 
0 x x x x x x x x 
1 x Oo Oo O O O o O 
2 D x Oo O Oo O o O 
3 * * x o o O O O 
4 * * * x O O o O 
5 * * * - x O Oo O 


1950 1960 1970 1980 1990 2000 
年 
0.8 
0.0 
0 5 10 15 20 25 
间隔 
图 2-9 3M 公司 股票 从 1946 年 2 月 到 1997 年 12 月 的 月 对 数 收益 率 的 
时 间 图 和 样本 自 相 关 函 数 图 


简 表 清楚 地 显示 由 “0O” 组 成 的 三 角形 的 左上 和 角 项 点 位 于 阶 (p, q)—(0,0) 处 . 只 
有 第 一 行 的 一 个 “x?” 是 例外 的 , 它 对 应 的 的 样本 EACF 值 为 0.09, RE 2/V623 = 
0.08 稍 大 一 点 . 因此 , EACF 表明 3M 公司 股票 的 月 对 数 收益 率 服从 一 个 ARMA(0,0) 
模型 (也 就 是 一 个 白 噪声 序列 ). 这 与 由 图 2-9 中 样本 ACE. 所 表明 的 是 一 致 的 . 
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表 2-5 3M 公司 股票 从 1946 年 2 月 到 1997 年 12 月 的 月 对 数 收 益 率 的 


样本 EACF 及 其 简 表 
J 样本 推广 的 自 相关 函数 
MA 的 阶 : q 
0 1 2 3 4 5 6 7 8 9 10 11 12 


P 

0 —0.05 —0.04 一 0.07 —0.01 0.02 0.06 —0.00 0.02 —0.01 —0.06 0.03 0.09 0.01 
1 —049 0.01 一 0.06 一 0.03 0.00 0.06 0.01 001 —0.01 -0.05 0.02 0.08 0.02 
2 一 0.45 —0.18 —0.05 0.01 —0.02 0.06 0.03 0.02 -001 —0 00 0.01 0.05 0.05 
3 —0.18 0.15 040 一 0.01 —0.01 0.05 —0.00 0.03 一 0.03 一 0.00 0.00 0.02 0.05 
4 042 0.04 0.39 —0.08 —0.01 0.01 —0.01 0.04 0.02 0.02 —0.00 0.01 0.03 
5 —0.3 0.24 0.41 0.07 0.28 0.01 0.01 0.05 —0.03 0.02 —0.01 0.00 0.04 
6 —0.07 —0.37 0.06 0.31 0.20 —0.09 0.01 0.06 —0.03 0.02 —0.01 0.00 0.03 


简化 的 EACF 3 
MA 的 阶 : q 


P 0 1 2 3 4 5 6 7 8 9 10 11 12 
0 O O O O O O o © O O Ò è © 
1 x O oO Oo O O O O O O O O O 
2 X x O o O O O Oo Oo o O O O0 
3 x x x Oo O O O O O O O O O 
4 x Oo x O O O O o Oo Oo O O O 
5 x x x O x O O O O O O O O 
6 Oo x Oo x x (6) O Oo Oo O O o O 


前 面 所 讨论 的 信息 准则 也 可 以 用 来 选择 ARMA 模型 . 具体 地 , 对 于 事先 指定 的 
正 整数 已 和 Q, 计算 ARMA(p, q) 模型 的 AIC( 或 BIC), 其 中 0<p< POS q € Q, 
并 且 选 取 使 AIC( 或 BIC) 取 最 小 值 的 模型 . 该 方法 需要 许多 模型 的 最 大 似 然 估计 ， 
在 一 些 情形 下 可 能 会 碰 到 在 估计 时 过 度 拟 合 的 困难 . 

EL ARMA(p. q) 模型 的 阶 确定 了 , 它 的 参数 就 可 以 用 条 件 似 然 法 或 精确 似 然 
法 来 估计 . 另外 , 残 差 的 Ljung-Box 统计 量 可 以 用 来 检验 所 拟 合 模型 的 充分 性 . 如 
果 模 型 是 正确 的 , Q (m) 渐 近 地 服 从 自由 度 为 m- g 的 x?- 分 布 . 其 中 q 表示 模型 
所 用 参数 的 个 数 . 


2.6.4 用 ARMA 模型 进行 预测 


和 ACF 一 样 , 只 要 将 MA 部 分 对 低 步 数 预测 的 影响 进行 调整 后 , ARMA (p, q) 
模型 的 预测 就 会 与 AR(p) 模型 的 预测 有 相似 的 特征 . 设 预测 原点 为 h, Fy HTE h 
时 刻 所 能 得 到 的 信息 集合 . ww,; 的 向 前 一 步 预测 为 


p q 
Fn (1) — E (rn41|Fh) = o + 9 pirht1-i — > bianyi, 


$—1 t—1 


相应 的 预测 误差 为 en (1) = rna — Pn (1) = anyi HA — HP PORE E 2E 0 HEH 
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Var [en (1)] = o2. 对 向 前 1 步 预测 , 我 们 有 
Fn (1) = E (rast Fh) = do +Y dif (L— i) — > bian (L— i), 
jL i=l 


其 中 , 41-i <0 Bf, Ff, (l—i) — rayi 34 Li 0 Rf, an (1— i) 20; S1-i <0 
时 an (1 — i) = ax 111 这 样 ,ARMA 模型 的 向 前 多 步 预测 可 以 递 推算 得 . 相应 的 预 
测 误差 为 
en (D) = rnt — fa (D), 

它 可 以 用 2.6.5 节 给 出 的 一 个 公式 (2.34) 很 容易 地 算出 . 
2.6.5 ARMA 模型 的 三 种 表示 

本 节 将 简单 地 讨论 平稳 ARMA(p, q) 模型 的 三 种 表示 . 这 三 种 表示 用 于 三 种 
不 同 的 目的 . 了 解 这 三 种 表示 会 更 好 地 理解 ARMA 模型 . 第 一 种 表示 是 (2.28) X, 
这 个 表示 很 紧 闫 并 量 在 参数 估计 时 很 有 用 . 另外, 它 也 可 用 于 递 推 计算 re 的 癌 前 
多 步 预测 , 见 2.6.4 节 的 讨论 . 

对 另外 两 种 表示 , 我 们 用 两 个 多 项 式 比 的 级 数 展开 式 (长 除法 ). 给 定 两 个 多 项 
Xt ó(B) -1— Y: &B* M 6(B) =1— Y; 6,B', 我 人 有 

于 一 í—1 


0(B) — Lg) 2 
B 
a —-1—-mB-nB-..zm«(B). (2.30) 
例如 , 若 6(B) = 1- B, 6(B) — 1—6,B, W 
v(B)- ip l+ - 6) B +g (1 ~ 1) B + GF (1 — 01) B 
r (B) = SE = 1 — (G1 - 6) B- 01 (1 — 01) B? — 63 (1 - 01) B? — +- 
— 6, 


HES v(B)m (B) = 1, 利用 Be = c 对 任意 常数 c 成 立 这 个 事实 (因为 常数 是 
随时 间 不 变 的 ), 我 们 有 


Qo 

00) 1-6—-——-60, (1) 1-4--:--6, 
AR 表示 
利用 (2.30) 式 的 结果 , ARMA(p, q) 模型 可 写成 


Qo 


‘i — Ph --sd + TITt=1 + WaTr—2 + W3Tt—3 | 505 + 04. (2.31) 
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这 个 表示 给 出 了 当前 收益 率 ny 对 过 去 收益 率 ri i > 0 的 依赖 关系 . 系数 (0) 称 
为 ARMA 模型 的 n- 权重 , 为 了 说 明 延 迟 值 rei XI r 的 贡献 随 i 的 增 大 而 逐渐 消 
A, 系数 x; 应 随 i 增 大 而 趋 于 零 . 一 个 ARMA(p, q) 模型 如 果 具 有 这 样 的 性 质 , 则 
称 它 为 可 逆 的 . 对 纯 AR 模型 , 9(B) = 1, S s (B) = 6(B). 这 是 一 个 有 限 阶 的 多 项 
XX. 从 而 对 i> p 有 mi = 0, 模型 是 可 逆 的 . 对 其 他 ARMA 模型 , 可 逆 性 的 充分 条 
件 是 : 多 项 式 9(B) 的 所 有 零点 的 模 大 于 1. 例如 , 对 MA(1) 模型 mm = (1 — 0B) ay. 
一 次 多 项 式 1-08 的 零点 是 B — 1/0. 从 而 , 如 果 1/]6,| > 1( 也 即 |0| <1), 则 
MA(1) 是 可 道 的 . 

由 (2.31) 式 的 AR 表示 , 一 个 可 逆 的 ARMA(p, q) 序列 re 是 当前 的 振动 * a, 
与 序列 过 去 值 的 加 权 平 均 的 线性 组 合 . 对 越 来 越 远 的 过 去 值 , 权重 呈 指 数 衰 减 . 

MA 表示 


同样 , 利用 (2.29) 式 , ARMA(p, q) 模型 也 能 写成 
rt — H + att piati + Yoat_2 +++: =p+y(B) az, (2.32) 


HP u = E(r) = do/(1—¢1 —--:—@p). 这 个 表示 清楚 地 说 明了 过 去 的 “扰动 ” 
atili > 0) 对 当前 收益 re 的 影响 . 系数 {di} 称 为 该 ARMA 模型 的 脉冲 响应 函 
数 (impulse response function). 对 弱 平 稳 序列 , 系数 v, BA i 的 增加 呈 指 数 衰减 . 
这 一 点 是 可 以 理解 的 , 因为 扰动 w_; 对 收益 率 mx 的 影响 应 该 随时 间 而 消失 . CRE, 
对 平稳 ARMA 模型 , 扰动 cri 不 能 对 序列 有 永久 的 影响 . 如 果 如 4 0, 这 样 的 MA 
表示 中 有 一 个 常数 项 , 它 就 是 re 的 均值 (也 即 po/ (1 一 总 一:… 一 68))、。 

(2.32) 式 的 MA 表示 在 计算 预测 误差 的 方差 时 也 是 有 用 的 . 在 预测 原点 h, 我 
们 有 an, ana, .... 从 而 , 向 前 1 步 预测 为 


Pr (I) = e+ dian + piriana ss, (2.33) 
相应 预测 误差 为 
en (l) = ana + Yieagi-1 7 7 + VI 841- 
因此 , 向 前 1 步 预测 误差 的 方差 为 
Var [en (D] = (1+ 0? + -+ Yi) 02, (2.34) 


正如 所 料 , 它 是 预测 时 间 长 度 1 的 非 减 函数 . 

最 后 ，(2.32) 式 的 MA 表示 还 提供 了 平稳 序列 均值 回转 的 一 个 简单 证 明 . SE 
稳 性 意味 着 当 i 一 oo 时 wi 趋 于 零 . 从 而 , 由 (2.33) R, 我 们 有 : 当 1 o0 时 ， 
Fn (1) 一 p. AA Pa (0) 是 rnp 在 预测 原点 h 的 条 件 期 望 ,| 述 结果 表示 , 从 长 期 
KE, 收益 率 序列 预期 会 趋 于 它 的 均值 , 也 就 是 说 , 序列 是 均值 回转 的 . 进一步 地 ， 
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由 (2.32) 式 的 MA Xon, 我 们 有 Var (ri) = (1 d- Y V2 | c2. 从 而 , 由 (2.34) st, 当 
i=] 
1 一 oc 时 , Var [en (1)] — Var (re). Fn (L) IAF j 的 速度 决定 了 均值 回转 的 速度 . 


2.7 单位 根 非 平稳 性 


到 目前 为 止 , 我 们 的 注意 力 还 是 集中 在 平稳 的 收益 率 序 列 上 . 在 某 些 研究 中 ， 
利康 、 汇 淮 或 资产 的 价格 序列 是 研究 对 和 象 , 这 些 序列 往往 是 非 平稳 的 . 对 于 资产 价 
格 序列 , 其 非 半 稳 性 主旨 是 由 十 价格 没有 固定 的 水 平 . 在 时 间 序 列 文献 中 , 这 样 的 
非 平稳 序列 叫做 单位 根 (Unit-root) 非 平稳 序列 . 单位 根 非 半 稳 序列 最 着 名 的 例子 是 
随机 游 动 模型 . 

2.7.1 ”随机 游 动 
若 时 间 序列 {pt} 满足 
Pt = Pi-1 + Qt, (2.35) 


其 中 po 是 一 个 实数 , AIK PAD AA, {a} 是 一 个 白 噪 声 序 列 , 则 称 {p} 
为 一 个 随机 游 动 . 车 p. 为 一 支 股 票 在 第 + 天 的 对 数 价 格 , 则 po 可 以 是 该 股票 最 初 
上 市 (initial public offering) 的 对 数 价格 (简称 为 “对 数 IPO 价格 "). 若 a, 的 分 布 
关于 零点 对 称 , 则 给 定 pi 的 条 件 下 , p 上 升 或 下 降 的 机 会 各 有 5096, 也 即 p, 将 
随机 地 上 升 或 下 降 ， 如 果 我 们 把 随机 游 动 模型 看 成 一 个 特殊 的 AR(1) 模型 , 那么 
Pra 的 系数 是 1, 这 不 满足 AR(1) 模型 平稳 性 的 条 件 . 从 而 , 随机 游 动 序列 不 是 弱 
平稳 的 , 称 之 为 单位 根 非 平稳 时 间 序 列 . 

随机 游 动 模型 可 广泛 地 用 来 作为 对 数 股 价 运 动 的 统计 模型 . 在 这 样 的 模型 下 ， 
股价 不 是 可 预测 的 或 均值 回转 的 .下面 说 明 这 一 点 : 模型 (2.35) 在 预测 原点 下 的 
向 前 一 步 预测 为 

Pr (1) = E (pni Phi Phi") = Pay 


它 就 是 预测 原点 的 对 数 股 价 , 这 样 的 预测 没有 实际 意义 . 向 前 两 步 预 测 为 


Pn (2) = E (Pr i2 [Ph Ph 1,7) = E (Phi + Apt2 [Ph Ph—1 777) 
= E (pri [Phi Phi: **) — Da (1) = Ph: 
这 又 是 预测 原点 的 对 数 股 价 . 事实 上, 对 任意 的 预测 步 长 1 0, 都 有 
Ph (I) = Ph- 


这 样 , 对 所 有 预测 步 长 , 随机 游 动 模型 的 点 预测 都 是 序列 在 预测 原点 的 值 . 从 而 , 该 
过 程 不 是 均值 回转 的 . 
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(2.35) 式 给 出 的 随机 游 动 模型 的 MA 表示 为 
Pt = Ot 041.1 + O4-2+---. 
这 个 表示 有 几 个 重要 的 实际 意义 . 首先 , 向 前 1 步 预测 误差 为 
en (l) = antt -=+ ena, 


从 而 Var [en (D] = loz, 当 1 — oo 时 发 散 到 无 穷 , 因此 , 随 着 预测 步 长 的 增 大 . Pht 
的 预测 区 间 的 长 度 将 趋 于 无 穷 . 这 表明 , BE 1 的 增 大 , 点 预测 Pn (1) 变 得 没有 用 
处 , 也 再 次 说 明了 该 模型 不 是 可 预测 的 ， 其 次 , 因为 当 / 增 大 时 , Var [es (0) 趋 于 无 
I, p. HERTZEAN. 理论 上 讲 , 这 意味 着 对 充分 大 的 t, 可 取 到 任何 实 
值 . 对 个 股 的 对 数 价格 P, 来 说 , 这 一 点 还 说 得 过 去 , 但 对 市 场 指数 来 讲 , 负 的 对 数 
价格 即使 有 也 是 很 少见 的 . 从 这 个 意义 上 讲 , 随机 游 动 模型 对 市 场 指数 的 适合 性 值 
得 怀疑 . 最 后 , 从 上 述 表 示 看 , 对 所 有 CH. v. = 1, 这 就 是 说 , 任何 过 去 的 “扰动 ” 
ai 对 py 的 影响 均 不 随时 间 衰 减 . 从 而 , 序列 有 强 记忆 性 , 因为 它 记 得 所 有 过 去 的 
“扰动 ”. 在 经 济 学 上 , 这 种 现象 就 是 “扰动” 对 序列 有 持久 的 效应 . 单位 根 时 间 序 列 
的 强 记 忆 性 也 可 以 从 样本 ACF 看 出 来 . 当 样 本 容量 增 大 时 , 样本 ACF WAF 1. 
2.7.2 ” 带 漂移 的 随机 游 动 

如 前 面 一 些 实证 例子 所 示 , 市 场 指数 的 对 数 收 益 率 序 列 会 有 小 的 正 均值 这 蕴 
涵 着 对 数 价 格 的 模型 应 为 

Pi = H+ Pt-1 + Gt, (2.36) 

其 中 u= E (pm — pia), {a} 是 白 噪声 序列 . 模型 (2.36) 中 的 常数 项 在 金融 研究 中 
很 重要 . 它 表 示 的 是 对 数 价 格 p, 的 时 间 趋 势 通常 称 其 为 模型 的 漂移 (drift). 为 
了 说 明 这 一 点 , 我 们 假定 初始 价格 为 po, 从 而 我 们 有 


Pi = H+ po +a 
P2 = H+ pi + 02 = 2u + po + ag 十 ai， 


ee t o | || on 


Pe =ty+ po + ay + ai +-+++ a3. 
上 式 中 最 后 一 个 等 式 表明 对 数 价 格 由 时 间 趋 势 ty 和 一 个 纯 随机 游 动 过 程 Xa 组 


成 因为 Var (5: ai) = to, 其 中 o2 为 a 的 方差 ,pt 的 条 件 标准 差 为 Viz。 它 比 
il 

pe 的 条 件 期 望 增长 的 速度 慢 . 从 而 , 如 果 画 出 p 随时 间 指标 t 变化 的 图 像 ,我 们 就 

有 一 个 斜率 为 / 的 时 间 趋势 . 正和 斜率 / 蕴涵 着 对 数 价格 最 终 趋 于 oo, MRR / A 

涵 着 对 数 价格 将 趋 于 -oo. 基于 这 个 讨论 , CRSP 价值 加 权 和 等 权重 指数 的 对 数 收 

益 率 序列 有 小 的 、 但 是 统计 显著 的 正 均值 这 个 现象 就 不 足 为 奇 了 . 


= 
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为 了 说 明 价 格 序列 漂移 参数 的 效应 , 我 们 考虑 3M 公司 股票 从 1946 年 2 月 到 
1997 年 12 月 的 月 对 数 收益 率 . 如 表 2-5 中 的 样 木 EACF Bros, 该 序列 无 显著 的 序 
列 相关 性 . 该 序列 服从 简单 的 模型 


Tt = 0.011 5 T ae, Ga = 0.063 9, (2.37) 


其 中 0.011 5 是 mm 的 样本 均值 , 其 标准 误差 为 0.002 6. 3M 公司 股票 的 月 对 数 收益 
率 在 1 吕 的 水 平 下 是 显著 不 同 于 零 的. 我 们 利用 对 数 收益 率 序列 来 构造 两 个 对 数 价 
格 序列 : 


t t 
* 
Pt = 》 Ti, Pt = 》 Oy, 
i=l =i 


其 中 a, 是 (2.37) 式 中 的 均值 修正 对 数 收益 率 (也 即 a, = re — 0.011 5). p. 是 3M 
公司 股票 的 对 数 价格 , 假设 初始 价格 为 0( 也 即 1946 年 1 月 的 对 数 价格 为 0). pr 是 
当 对 数 收益 率 的 均值 为 0 时 对 应 的 对 数 价格 . 图 2-10 所 示 的 是 p 和 pz 的 时 间 图 ， 
还 有 直线 y = 0.011 5t. 从 该 图 中 可 以 看 出 , (2.37) 式 中 的 常数 0.011 5 的 重要 性 是 
明显 的 . 另外 , 如 我 们 所 料 , zw 上 升 趋势 的 斜率 大 致 为 0.011 5. 


1950 1960 1970 1980 1990 2000 
年 
图 2 10 3M 公司 股票 从 1946 年 2 月 到 1997 年 12 月 的 对 数 价格 的 时 间 图 . 假定 1946 年 
1 月 的 对 数 价格 为 0 虚线 为 没有 时 间 趋 势 的 对 数 价 格 , 直线 为 ye = 0.011 5t 


最 后 应 指出 的 是 , 型 解 时 间 序 列 模型 中 常数 项 的 意义 是 重要 的 . 首先 , 对 (2.22) 
式 中 的 MA(q) 模型 , 常数 项 就 是 序列 的 均值 ; 其 次 , 对 (2.9) 式 中 的 平稳 AR(p) 
模型 或 (2.28) 式 中 的 平稳 ARMA(p, q) 模型 ， 常 数 项 与 均值 有 关 , 关系 为 u = 
go/ (1— 41 —— y). Jn. 对 带 漂移 的 随机 游 动 ， 常数 项 成 为 了 时 间 斜 举 . 这 
些 关 于 时 间 序 列 模型 中 常数 项 不 同 的 解释 , 清楚 地 阐明 了 动态 模型 与 通常 的 线性 回 
归 模 型 之 间 的 不 同 . 

动态 模型 与 回归 模型 之 间 的 另 一 个 重要 差别 可 用 AR(1) 模型 和 简单 的 线性 回 
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归 模 型 来 说 明 : 
re=dotOimita, — Ye = Bo + BiTi + at. 


要 使 AR(1) 模型 有 意义 , 须 使 系数 o1 满足 |h) < 1, 而 系数 1 可 以 是 任何 固定 的 
实数 . 


2.7.3 ” 带 趋势 项 的 时 间 序 列 
与 刻画 线性 趋势 紧密 联系 的 一 个 模型 是 如 下 带 趋 势 项 的 时 间 序 列 模型 : 


pt = Bo + Bit Tt, 


其 中 or, 是 - -个 平稳 时 间 序 列 , 例如 平稳 AR(p) 序列 . 这 里 , p, 随时 间 以 5. 的 速 
率 线性 增长 , 因此 能 够 刻画 类 似 于 带 漂移 的 随机 游 动 模型 的 行为 . 然而 , 这 两 个 模 
型 有 一 个 主要 的 区 别 . 为 了 说 明 这 一 点 , 假定 po 是 固定 的 ， 带 漂移 的 随机 游 动 模 
型 假定 均值 是 EUP) = po + ut, 方差 是 Var(pi) = to2, 两 者 都 依赖 于 时 间 . 另 一 方 
面 , 带 趋势 项 的 时 间 序 列 模型 假定 均值 是 Elp) = o + Bit, 它 依赖 于 时 间 , 而 方差 
是 Var(p) = Var(m), 它 是 有 限 的 且 不 随时 间 变 化 . 带 趋势 项 的 时 间 序 列 模型 可 以 
通过 简单 的 回归 分 析 移 除 掉 时 间 趋 势 而 转换 为 平稳 时 间 序 列 . 关于 对 带 趋势 项 的 
时 间 序 列 模型 的 分 析 , 可 参见 2.9 节 . 


2.7.4 一般 的 单位 根 非 平 稳 模型 


考虑 ARMA 模型 . 如 果 我 们 把 ARMA 模型 推广 到 允许 其 AR 多 项 式 以 1 作 
为 它 的 特征 根 , 则 模型 就 变 成 了 众所周知 的 自 回归 求 和 滑动 平均 (ARIMA) 模型 . 
因为 其 AR 多 项 式 有 单位 根 1, 故 ARIMA 模型 称 为 是 单位 根 非 平稳 的 . 像 随机 游 
动 模型 一 样 , ARIMA 模型 有 强 记 忆 性 , 因为 它 的 MA 表示 中 的 w 系 数 不 随 时 间 衰 
减 , 从 而 过 去 的 扰动 a1_; 对 序列 有 持久 效应 . 处 理 单位 根 非 平稳 性 的 惯用 方法 是 用 
差分 化 (differencing). 

差分 化 


个 时 间 序 列 y, 称 为 是 -个 ARIMA(p, 1, q) 过 程 , 如 果 变 换 后 的 序列 c, = 
y gea = (1— B) ye 服从 一 个 平稳 可 逆 的 ARMA(p, q) 模型 . 在 金融 中 , 通常 认 
为 价格 序列 是 非 平 稳 的 , 而 对 数 收 益 率 序列 m = In (pe) — In (pii) 是 平稳 的 . 这 时 ， 
对 数 价格 序列 是 单位 根 非 平稳 的 , 从 而 可 当 作 ARIMA 过 程 对 待 . 在 时 间 序 列 文献 
中 , 通过 考虑 时 间 序 列 相 邻 两 值 的 变化 量 所 构成 的 序列 , 把 一 个 非 平稳 序列 变换 成 
一 个 平稳 序 刻 , 这 样 的 思想 叫做 差分 化 . 更 正规 地 说 , 称 ct = ye — yea Ame 的 一 
阶 差 分 序列 . 在 有 些 科 学 领域 , 时 间 序 列 y, 可 能 会 有 多 重 单位 根 , 表 要 做 多 软 差 分 
才能 变 成 平稳 序列 . 例如 , E y, 和 它 的 一 阶 差 分 序列 e = ye — wai 都 是 单位 根 非 
平稳 的 , 但 st = ct — 63 = yea +y ESP, 则 y, 就 有 双重 单位 根 ， 
st 是 y 的 二 阶 差 分 序列 . AF s, 服从 ARMA(p, q) 模型 , 则 y, 是 ARIMA(p, 2, q) 
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过 程 . 对 这 样 一 个 时 间 序 列 , 车 s, 有 非 零 的 均值 , 则 y 有 一 个 二 次 时 间 函 数 , 这 个 
二 次 时 间 函 数 的 系数 与 s 的 均值 有 关 . 进行 季节 性 调节 后 的 美国 季度 国民 总 产值 
暗含 的 通货 紧缩 (implicit price deflator) 序列 可 能 会 有 双重 单位 根 , 但 该 序列 的 二 
阶 差分 序列 的 均值 并 不 是 显著 地 不 同 于 零 的 ( 见 本 章 末 的 练习 题 ). Box, Jenkins 和 
Reinsel(1994) 讨论 了 一 般 ARIMA 模型 的 很 多 性 质 . 


2.7.5 ”单位 根 检验 


为 了 检验 资产 的 对 数 价格 m 是 否 服从 一 个 随机 游 动 或 一 个 带 漂移 的 随机 游 动 ， 
我 们 利用 如 下 两 个 模型 
pe = Oipr-1 十 et (2.38) 


Pe = Go + Pipe-1 | Ct, (2.39) 


其 中 et 为 误差 项 . 考虑 原 假设 Ho: = 1 对 备 择 假设 Ha: 内 < 1. 这 是 一 个 著名 
的 单位 根 检验 问题 , 参见 Dickey 和 Fuller(1979). 一 个 方便 的 检验 统计 量 就 是 在 原 
假设 下 由 的 最 小 二 乘 估计 的 t— 比 . 对 (2.38) 式 , 由 最 小 二 乘法 可 得 


T : 2 

jy — Dianam ga Een $m) 

aa T , en x 
Pa Pli T—1 


其 中 po = 0, T 为 样本 容量 , t- 比 为 


oT wa ài-1 = ST Beats 
的 标准 莽 Dey Xi PA 

这 个 t- 比 通 常 称 为 Dickey-Fuller 检验 . 3$ (e,) 是 一 个 白 噪 声 序 列 , 其 稍 高 于 二 
阶 的 矩 是 有 限 的 , W T — oo 时 DF- 统计 量 趋 于 一 个 标准 布朗 运动 的 函数 , 更 多 
的 有 关 信 息 可 参见 Chan 和 Wei(1988) 和 Phillips(1987). 如 果 to = 0 但 我 们 采用 了 
(2.39) 式 , 则 所 得 的 检验 轴 =1 的 三 比 将 趋 于 另 一 种 非 标准 的 渐 近 分 布 . 上 述 两 
种 情形 都 是 用 模拟 方法 来 得 到 检验 统计 量 的 临界 值 , 部 分 临界 值 参 见 Fuller(1976) 
的 第 8 章 . 然而 , 如 果 如 AO 且 使 用 的 是 (2.39) R, 则 用 来 检验 页 1 的 万 比 是 
渐 近 正 态 的 , 但 此 时 将 需要 很 大 的 样本 容量 来 保证 渐 近 正 态 分 布 的 使 用 . 标准 布朗 
运动 将 在 本 书 第 6 章 介 绍 . 

对 许多 经 济 时 间 序 列 而 言 , ARIMA(p, d, q) 可 能 比 (2.3.9) 式 给 出 的 简单 模型 
更 适合 . 在 计量 经 济 文献 中 , 经 常 使 用 的 是 AR(p) 模型 , 用 zx 表示 该 序列 . ATH 
证 在 AR(p) 过 程 中 是 否 存 在 单位 根 , 可 以 用 如 下 回归 来 检验 原 假 设 Ho : 8 — 1X 
Hes < is 

p-—l 


Tt = Cr+ Barr» +Y di Ari e (2.40) 


i=1 
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其 中 o, 是 关于 时 间 指 标 t 的 确定 性 函数 , Arj = zj —r; a 是 x, 的 差分 序列 . 在 实 
RP, e, 可 以 是 零 , 常数 , 或 者 c 一 wo 十 wit. 8 一 1 889 c 比 为 

B-—1 
PRIEREZE 
其 中 6 8 的 最 小 二 乘 估 计 , ER t- 比 就 是 著名 的 扩展 的 Dickey-Fuller 单位 根 
检验 . 注意 到 由 于 一 阶 差分 , (2.40) 式 等 价 于 一 个 带 确定 性 函数 c 的 AR(p) 模型 . 
(2.40) 还 可 以 改写 为 


ADF — 检验 = 


Ar, = ce + BeTt—1 + >》 ,内 Ar + er, 
£1 

其 中 B. = 8 一 1. 我 们 可 以 等 价 地 检验 Ho : B. = 0 Xt Ha : Be <0. 

例 2.2 考虑 美国 从 1947 年 第 一 季度 到 2003 年 第 4 季度 的 季度 GDP 的 对 数 
序列 .该 序列 呈 上 升 趋势 , 表明 美国 经 济 的 增长 , 另外 , 该 序列 有 高 度 的 序列 相关 
TE, 见 图 2-11 WEW. 一 阶 差 分 序列 表示 美国 GDP 的 增长 率 , 这 也 在 图 2-11 中 
给 出 . 该 差分 序列 似乎 在 一 个 固定 的 均值 附近 变化 , 尽管 这 种 变化 在 最 近 几 年 比较 
小 ， 为 了 证 实 所 观察 到 的 现象 ,我们 对 数 序列 进行 Dickey-Fuller 单位 根 检验 . FE 
于 图 2-11 给 出 的 差分 序列 的 样本 PACF, 我 们 选择 p = 10. 我 们 还 用 了 一 些 其 他 
i p 的 值 , 然而 都 没有 改变 检验 的 结论 : 当 p=10 时 ADF 检验 统计 量 是 —1.131, 


(a) (c) 
0.06 
9 = 
a S 0.04 
B 8 g 
c & 0.02 
7 
L^ à Xo 00 
一 0.02 
1950 1960 1970 1980 1990 2000 1950 1960 1970 1980 1990 2000 
年 年 
(b) (d) 
0.58 
RE 
2 04 


PACF 


ü 5 10 15 5 10 15 
间隔 间隔 
图 2-11 美国 从 1947 年 第 一 季度 到 2003 年 第 4 季度 的 季度 GDP 的 对 数 序列 : (a) 对 数 
GDP 序列 的 时 间 图 ; (b) 对 数 GDP 序列 的 样本 ACF; (c) 一 阶 差 分 序列 的 时 间 图 ; 
(d) 差分 序列 的 样本 PACF 
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p 值 是 0.703 8, 表明 单位 根 假设 不 能 被 拒绝 ， 由 下 面 的 S-Plus 输出 结果 知 , 3 = 
1+ 4. = 1 — 0.000 6 = 0.999 4. 


S-Plus 演示 
输出 结果 . 


> adft-unitroot (qdp,trend='c' ,method=’ adf’ , lags=10) 
> summary (adft) 


Test for Unit Root: Augmented DF Test 


Null Hypothesis: there is a unit root 
Type of Test: t test 
Test Statistic: -1.131 
P-value: 0.7038 


Coefficients: 
Value Std. Error t value Pr(>|t|) 
lagi -0.0006 0.0006 -1.1306 0.2595 
lag2 0.3797 0.0679 5.5946 0.0000 
lag1ł10 0.1798 0.0656 2.7405 0.0067 
constant 0.0123 0.0048 2.5654 0.0110 


Regression Diagnostics: 


R-Squared 0.2831 
Adjusted R-Squared 0.2485 


Residual standard error: 0.009498 on 214 degrees of freedom 


作为 另外 一 个 例子 , 考虑 S&P500 指数 从 1990 Æ 1 月 到 2003 年 12 月 的 日 对 
数 收益 率 序列 , 共有 3532 个 观测 值 . 图 2-12 给 出 了 该 序列 的 时 间 图 . 如 果 想 从 实 
证 的 角度 去 验证 该 指数 是 否 服 从 带 漂 移 的 随机 游 动 , 则 进行 单位 根 检验 是 必要 的 . 


7.0 


对 数 (指数 ) 


6.0 


1990 1992 1994 1996 1998 2000 2002 2004 
年 


2-12 S&P500 指数 从 1990 年 1 月 2 日 到 2003 年 12 月 31 日 的 对 数 日 收益 率 的 时 间 图 
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为 此 , 在 应 用 扩展 的 Dickey-Fuller 检验 时 用 e; = wo 二 wit. 进一步 , 我 们 选择 p= 14, 
这 是 因为 对 于 一 阶 差分 序列 , AIC 选择 了 AR(13) 模型 . 检验 统计 量 的 值 为 —0.9648, 
p 值 为 0.946 9. 因此 , 在 任何 合适 的 显著 性 水 平 下 , 单位 根 检验 都 不 能 被 拒绝 . 然 
而 , 在 通常 的 5 名 的 显著 性 水 平 下 , 对 确定 性 项 的 参数 估计 与 零 没有 显著 差异 . 综 上 
所 述 , 在 所 考虑 的 时 期 内 , 指数 的 对 数 序列 包含 一 个 单位 根 , 但 是 没有 很 强 的 证 据 
表明 该 序列 有 时 间 趋 势 . 

S-Plus 演示 

输出 结果 . 


> adft=unitroot (sp,method-'adf',trend-'ct',lags-14) 
> summary (adft) 


Test for Unit Root: Augmented DF Test 


Null Hypothesis: there is a unit root 
Type of Test: t test 
Test Statistic: -0.9648 
P-value: 0.9469 


Coefficients: 
Value Std. Error t value Pr(»|t|) 
lagi -0.0008 2.0008 -0.9648 0.3347 
lagi4 0.0319 9.0169 1.8894 0.0589 
constant 0.0056 0.0054 1.0316 0.3023 
time 0.0000 0.0000 0.4871 0.6262 


Regression Diagnostics: 


R-Squared 0.0107 
Adjusted R-Squared 0.0065 


Residual standard error: 0.01049 on 3514 degrees of freedom 


2.8 季节 模型 


有 些 金融 时 间 序 列 , 如 公司 股票 每 股 的 季度 莉 利 , 呈现 出 一 定 的 循环 或 周期 性 . 
这 样 的 时 间 序 列 叫 做 季节 性 时 间 序 列 . 图 2-13a 所 示 的 是 Johnson and Johnson 公 
司 每 一 股份 的 季度 列 利 的 时 间 图 , 时 间 是 从 1960 年 第 1 季度 到 1980 年 最 后 一 个 
季度 . 此 数据 集 来 自 于 Shumway 和 Stoffer(2000), 它 呈 现 出 一 些 特 殊 的 特征 . 特别 
地 , 我 们 可 以 看 到 在 样本 期 间 内 和 折 利 呈 指 数 型 上 升 , 并 有 很 强 的 季节 性 . 另外 , 随时 
间 的 推移 , 盔 利 的 变化 性 在 增加 .其 循环 形式 每 年 重复 一 次 , 从 而 此 序列 的 周期 是 
4. 如 果 我 们 考虑 的 是 月 数据 (如 Wal-Mart 商店 的 月 销售 额 ), 则 周期 是 12. 季节 性 
时 间 序 列 模型 在 给 与 天 气 有 关 的 衍生 产品 定价 和 能 源 期 货 的 定价 方面 也 是 有 用 的 ， 
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因为 绝 大 部 分 与 环境 有 关 的 时 间 序 列 都 会 显示 出 很 强 的 季节 性 . 

季节 性 时 间 序 列 的 分 析 已 有 很 长 的 历史 . 在 有 些 应 用 中 , 季节 性 的 重要 性 是 次 
要 的 , 我 们 可 把 它 从 数据 中 消除 , 得 到 经 季节 性 调整 后 的 时 间 序 列 , 然后 再 用 来 做 
推断 . 从 数据 中 消除 季节 性 的 过 程 叫做 季节 调整 (seasonal adjustment). 美国 政 
府 公布 的 多 数 经 济 数 据 是 经 季节 调整 的 (如 GDP 的 增长 率 和 失业 率 ). 在 其 他 一 些 
应 用 中 , 如 进行 预测 时 , 数据 的 季节 性 和 其 他 特征 一 样 重要 , 必须 进行 相应 的 处 理 . 
因为 预测 是 金融 时 间 序 列 分 析 的 一 个 主要 目的 ,故我 们 把 注意 力 放 在 后 一 个 话题 
上 , 并 讨论 一 些 在 季节 性 时 间 序 列 建 模 中 有 用 的 经 济 计量 模型 . 


2.8.1 季节 性 差分 化 


图 2-13b 所 示 的 是 Johnson and Johnson 公司 每 股 对 数 莉 利 的 时 间 图 . 我 们 进 
行 对 数 变 换 有 两 个 原因 : 一 是 处 理 序列 的 指数 型 增长 , 新 的 时 间 图 证 实 了 序列 取 对 
数 后 的 确 是 线性 增长 的 ; 二 是 对 数 变 换 用 来 稳定 序列 的 波动 性 . 图 2-13a 中 的 序列 
的 波动 有 上 升 趋 势 , 这 种 上 升 趋势 在 新 图 中 已 经 消失 . 对 数 变换 在 金融 、 经济 的 时 
间 序 列 分 析 中 是 常用 的 . 在 这 个 具体 例子 中 , 因为 盈利 是 正 的 , 所 以 在 变换 之 前 不 
须 作 调 整 . 而 在 有 些 场合 , 我 们 需要 对 每 个 数据 点 加 上 一 个 正常 数 后 再 作对 数 变换 . 
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图 2-13 Johnson and Johnson 公司 股票 从 1960 年 到 1980 ERER AOZ E RAR i R: 

(a) 观察 到 的 每 利 , (b) IRAR 
WOT AY oy. 图 2-14 的 左上 角 是 的 样本 自 相 关 函 数 图 , 它 表 明 每 股 的 
季度 对 数 盘 利 具 有 强 的 序列 相关 性 ， 处 理 序列 的 这 种 强 序列 相关 性 的 一 个 惯用 的 
方法 是 考虑 n 的 一 阶 差分 序列 (也 即 Az, =a, — tii = (1— B) z). 2-14 的 左 
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下 角 是 Ax, 的 样本 自 相 关 函 数 图 , 可 见 当 间隔 是 周期 4 的 倍数 时 相关 性 强 , 这 是 季 
节 性 时 间 序 列 的 样本 自 相 关 函 数 的 典型 表现 . 按照 Box , Jenkins 和 Reinsel(1994) 
的 第 9 章 的 内 容 , 我 们 对 An, 作 另 一 个 差分 , 也 即 

Ag (Az) = (1 一 B*) Aa, 一人 Am 一 人 ci = 2% TES =— Td + Tt 
SET A4 = 1 一 B* 叫做 季节 性 差分 化 (seasonal differencing). 一 般 地 , 对 一 个 周 
期 为 s 的 季节 性 时 间 序 列 y, 季节 性 差分 意 指 

Asyt = yr — yi-s = (1 — B*) yi. 

通常 的 差分 Aye = yi — yia = (1 — B) y, 叫做 正规 差分 化 (regular differencing). 
2-14 的 右 下 角 是 AsAz; 的 样本 自 相关 函数 , 它 在 间隔 为 1 处 有 一 显著 的 负 值 
在 间隔 为 4 时 有 一 个 稍 强 的 负 相 关 . 为 了 完整 性 , 图 2-14 还 给 出 了 季节 差分 序列 
Aare 的 样本 自 相 关 函 数 图 . 


序列 : rz 序列 : ds 
1.0 1.0 
0.6 0.6 
LE 
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图 2-14 Johnson and Johnson 公司 股票 从 1960 年 到 1980 年 每 股 季 度 荀 利 的 对 数 序 列 的 样 
本 自 相 关 函 数 , 其 中 zt 是 对 数 盟 利 ,“dz” 是 一 阶 差分 序列 , “ds” 是 季节 性 差分 序列 ， 
“dzds” 表 示 经 止 规 差 分 后 再 季节 差分 的 序列 


2.8.2 ”多 重 季节 性 模型 
图 2-14 中 (1— B*) (1— B) x, 的 样本 ACF 的 表现 在 季节 性 时 间 序 列 中 是 常 
见 的 . 它 使 我 们 引进 了 下 面 特 殊 的 季节 性 时 间 序 列 模型 : 
(1 — B*) (1 — B)z, = (1 0B) (1— ƏB’) a, (2.41) 
其 中 s 是 序列 的 周期 , a; JÉÉIHRPSI AI, | 由 < 1, |6| < 1， 此 模型 在 文献 中 称 
为 航空 模型 (airline model), JL Box, Jenkins 和 Reinsel(1994) 第 9 章 . 它 被 广泛 


66 第 2 章 线性 时 间 序 列 分 析 及 其 应 用 


地 应 用 于 季节 性 时 间 序 列 的 建 模 . 此 模型 的 AR 部 分 由 正规 差分 和 季节 差分 两 
部 分 组 成 ,而 MA 部 分 包括 两 个 参数 ， 下 面 将 精力 放 在 该 模型 的 MA 部 分 , id 
w, = (1 — B*)(1— B):,, MA 


uy = (1 = 0B) (1 = OB*) a, = Q; — Ba, 1 = Qar_s - 60a, 5-1, 
其 中 s > 1. 容易 得 到 卫 (w) = 0, 并 且 
Var (w) = (1 + €?) (1+ ©?) o2， 
Cov (uy, uy .1) = —0 (1+ 0?) o7, 
Cov (un, 10.41 ) — 08c?, 
Cov (uy, wy.) = —© (1+ 6?) 02, 
Cov (wą, wt, 1) = 0802, 


Cov (wy, w,..1) = 0, 其 中 1 # 0,1,s—1,8,8+ 1. 


因此 , w, 的 ACF 为 
—0Ü EE. " E i 00 
ieee feqq Pe eee ae TEE 


MX} 1201f812z1,5—1,55-- 178 o =0. 例如 , 如 果 w 是 季度 时 间 序 列 , 那么 
s=4 且 它 的 ACF 只 在 间隔 1, 3, 4, 5 处 非 零 . 

把 上 述 ACF 与 MA(1) 模型 y= (1 — OB) a, 和 MA(s) 模型 z = (1 — OB*) a, 
的 ACF 相 比 较 会 看 出 有 意思 的 结论 . y 和 z 的 ACE 分 别 是 
和 pi(y)=0, l>1; 


TU -0 
pi y "^ 148? 


De 和 p(z)=0, I>0 H Izs. 
我 们 看 到 (a)pi = pı (y); (b) ps = ps (2); (c)ps-1 = psH = pı (y) x ps (2). 从 而 , un 
在 间隔 s — 1I s-- 1 处 的 ACF 可 以 认为 是 间隔 为 1 和 间隔 为 s 的 序列 相关 性 相 
互 作用 的 结果 . w 的 模型 称 为 多 重 季节 性 MA 模型 . 实际 中 , 多 重 季节 性 模型 意 
味 着 序列 的 正规 部 分 与 季节 部 分 的 动态 结构 是 近似 正 交 的 . 

模型 


ps (x) = 


w,—(1-08B—OB")a, |0«1|, |O|«1 (2.42) 


是 一 个 非 乘 积 季 节 性 MA 模型 . 易 见 , 对 (2.42) 式 的 模型 有 papi = 0. 乘积 模型 比 
对 应 的 非 乘 积 模型 更 节省 , 这 是 因为 虽然 钠 个 模型 用 了 相同 数目 的 参数 , 但 乘积 模 
型 有 更 多 非 零 的 ACF. 
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例 2.3 ”在 此 例 中 , 我 们 把 航空 模型 应 用 到 Johnson and Johnson 公司 股票 从 1960 
年 到 1980 年 的 每 股 季度 盘 利 的 对 数 序列 上 去 . 基于 精确 似 然 法 所 拟 合 的 模型 为 


(1 — B) (1 — B*) x = (1 — 0.678B) (1 — 0.314B*) a, ĉa = 0.089, 


其 中 两 个 MA 参数 的 标准 误差 分 别 为 0.080 和 0.101, 残 差 的 Ljung-Box 统计 量 为 
Q (12) = 10.0, 其 p 值 为 0.44. 模型 看 起 来 是 充分 的 . 

为 了 说 明 上 述 季节 性 模型 的 预测 表现 , 我 们 利用 前 76 个 观察 值 重新 估计 模型 
的 参数 , 而 把 最 后 8 个 数据 点 用 来 进行 预测 评价 .以 h = 76 为 预测 原点 计算 向 前 
1 步 至 8 步 预测 值 和 它们 的 标准 误差 . 为 得 到 每 股 盔 利 的 预测 值 , 利用 第 1 章 中 给 
出 的 正 态 分 布 与 对 数 正 态 分 布 之 间 的 关系 , 先进 行 一 个 反对 数 变 换 . 图 2-15 给 出 了 
模型 的 预测 表现 , 其 中 实 线 表 示 实 际 观 察 值 , 点 预测 值 用 一 些 点 表示 , 两 条 虚线 所 
示 的 是 95%% 的 区 间 预 测 . 预测 值 显示 出 强烈 的 季节 性 , 并 与 实际 观察 值 相近 . 最 后 ， 
HFR EREA HANA, 可 参见 本 书 11.7 35. 

当 一 个 时 间 序 列 的 季节 性 表现 随时 间 稳 定 的 (也 即 , 近似 于 确定 性 函数 ) 时 候 ， 
可 用 哑 变 量 (dummy variable) 来 处 理 季节 性 . 有 些 分 析 师 就 采用 这 种 方法 . 然而, 
确定 的 季节 性 只 是 前 面 讨论 的 乘积 季节 性 模型 的 一 个 特殊 情形 , 如 o = 1 时 , E 
型 (2.41) 包含 一 个 确定 的 季节 性 成 份 . 因此 , 当 季 节 性 是 确定 的 时 候 , 用 哑 变 量 或 者 


f Fi] 


1978 1979 15980 1981 
年 
图 2-15 Johnson and Johnson 公司 股票 每 股 季度 芥 利 的 点 预测 和 区 间 预 测 . 预测 原点 是 1978 
年 的 第 4 季度 . 实 线 表示 实际 观测 值 , 黑 点 表示 点 预测 值 , 两 条 虚线 表示 的 是 05% 的 
区 间 预 测 


用 乘积 季节 性 模型 都 能 得 到 相同 的 预测 结果 . 但 是 , 当 季节 性 不 确定 的 时 候 , ae 
量 方法 会 导致 较 差 的 预测 . 在 实际 中 , 我 们 建议 用 精确 似 然 法 去 估计 一 个 乘积 季节 
性 模型 , 特别 是 当 样本 容量 较 小 或 可 能 存在 一 个 确定 的 季节 性 成 份 时 . 

例 2.4 为 了 说 明确 定性 的 季节 性 ,考虑 CRSP Decile 1 指数 从 1960 年 1 月 到 
2003 年 12 月 的 月 简单 收益 率 , 共有 528 个 观测 . 图 2-16a 给 出 了 序列 的 时 间 图 , 该 
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图 并 没有 显示 出 序列 有 季节 性 . 然而 , 图 2-16b 给 出 的 样本 ACF 在 间隔 为 12, 24, 
36 以 及 1 处 显著 的 不 为 0. 如 果 接 受 季 节 ARMA 模型 , 则 模型 具有 以 下 形式 : 


(1 — $i B)(1 — $13B?)R, = c+ (1 — 012 B'?)a,, 
其 中 R 表示 月 简单 收益 率 . 用 条 件 似 然 方法 所 拟 合 的 模型 是 
(1 — 0.25B)(1— 0.99B!?) R, = 0.0004 + (1 —0.92B'?)a,, 6, = 0.071. 
MA 系数 靠近 1, 表明 所 拟 合 的 模型 接近 于 不 可 逆 . 如 果 用 精确 似 然 方法 , 我 们 有 


(1 — 0.264B)(1 — 0.996 B'*) R; = 0.0002 + (1 — 0.999B'!?)a,, ĉa = 0.067. 


s-rtri 
rin-jan 


1960 1970 1980 1990 2000 1960 — 1970 1980 1990 2000 
年 


(d) 


间隔 间隔 
图 2-16 CRSP Decile 1 指数 从 1960 年 1 月 到 2003 年 12 月 的 月 简单 收益 率 : (a) 简单 收益 
BAHT (A) PA; (b) 简单 收益 率 的 样本 ACP; (c) 调整 1 月 效应 后 的 简单 收益 率 的 时 间 
Fg; (d) 调整 1 月 效应 后 的 简单 收益 率 的 样本 ACF 
可 以 清楚 地 看 到 季节 AR 和 MA 因子 之 间 的 取消 . 利用 精确 似 然 方法 以 及 估计 的 
结果 说 明 可 能 存在 确定 性 的 季节 性 . 为 了 进一步 证 实 确定 性 季节 性 的 存在 , 我 们 关 
于 1 月 份 定义 哑 变 量 , 即 


TER i,” 车 t 在 1 月 份 内 ， 
i 0, 其 他 . 


并 应 用 简单 的 线性 回归 
Ri = Bo + Bi Samy + er. 
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图 2-16 的 右 侧 给 出 了 上 述 简 单线 性 回归 残 差 的 时 间 图 和 样本 ACF. 从 样本 ACF 
来 看 , 在 任何 间隔 为 12 的 倍数 处 都 没有 序列 相关 性 , 这 表明 通过 1 A Ga 
经 成 功 地 消除 了 季节 性 . 因此 , Decile 1 的 月 简单 收益 率 的 季节 性 主要 是 由 于 1 月 
效应 (January effect) 产生 的 . 
SCA 演示 

输出 结果 . 


tsm ml. model (1) (12)decl=cl+(12)noise. 


estim ml. hold resi(rl) 


SUMMARY FOR UNIVARIATE TIME SERIES MODEL -- M1 


VAR TYPE OF ORIGINAL DIFFERENCING 
VARIABLE OR CENTERED 


DEC1 RANDOM ORIGINAL NONE 


PAR. VAR. NUM./ FACTOR ORDER CONS- VALUE STD " 


LABEL NAME  DENOM. TRAINT ERROR VALUE 
1 C4 CNST 1 0 NONE .0004 .0003 1.11 
2 DEC1 MA 1 12 NONE .9213 .0205 44,90 
3 DEC1 AR 1 1 NONE .2496 .0419 5.95 
4 DEC1 AR 2 12 NONE .9943 .0094 105.71 
EFFECTIVE NUMBER OF OBSERVATIONS . . 515 

SPRUE e cate © £9) (m o» Fool we Xu 0.207 

RESIDUAL STANDARD ERROR. . . . . . . 0.705662E-01 


estim ml. method exact. hold resi (zl) 


SUMMARY FOR UNIVARIATE TIME SERIES MODEL -- M1 


VAR. TYPE OF ORIGINAL DIFFERENCING 


VAR. OR CENTERED 
DEC1 RANDOM ORIGINAL NONE 
PAR. VARI. NUM./ FACTOR ORDER  CONS- VALUE STD T 
LARETL, NAME DENOM. TRAINT ERROR VALUE 
1 C1 CNST 1 0 NONE .0002 .0002 .67 
2 DEC1 MA 1 12 NONE .9989 .0156 63.99 
3 DEC1 AR 1 1 NONE .2638 .0424 6.23 
4 DEC1 AR 2 12 NONE .9963 .0058 170.55 
EFFECTIVE NUMBER OF OBSERVATIONS . . 515 
R-SQUARE . . . . Bene & Bee dey Ta 0.283 


RESIDUAL STANDARD ERROR. . . . . . . 0O.670734E-01 
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2.9 ” 带 时 间 序 列 误差 的 回归 模型 


在 许多 应 用 中 , 主要 的 兴趣 在 于 研究 两 个 时 间 序 列 的 关系 . 金融 中 的 市 场 模型 
就 是 一 例 , 其 中 , 在 市 场 模型 中 , 我 们 需要 找 出 个 股 收益 率 与 市 场 指数 收益 率 之 间 
的 关系 . 利率 的 期 限 结构 也 是 一 个 例子 , 这 时 要 研究 的 是 不 同期 限 的 利率 之 间 的 关 
系 怎样 随时 间 演 变 . 这 些 例子 导致 我 们 考虑 如 下 形式 的 线性 回归 : 


rt 三 位 十 Brat -+ Ei (2.43) 


其 中 rit 和 rat 是 两 个 时 间 序 列 , e, 表示 误差 项 . 经 常用 最 小 二 乘 (LS) 方法 来 估计 
模型 (2.43). 车 {et} 是 白 噪 声 序列 , 则 LS 方法 给 出 的 估计 是 相合 的 . 然而 , 在 实际 
中 经 常 过 到 误差 e, 是 序列 相关 的 情形 . 这 时 , 模型 (2.43) 就 是 一 个 带 时 间 序 列 误 
差 的 回归 模型 , 并 且 最 小 二 乘法 (LS) 所 产生 的 a 和 9 的 估计 可 能 是 不 相合 的 . 

带 时 间 序 列 误差 的 回归 模型 在 经 济 、 金融 中 有 广泛 应 用 , 但 它 也 是 最 经 常 被 误 
用 的 经 济 计量 模 击 之 一 , 因为 e. 的 序列 相关 性 经 常 被 忽视 . 故 应 该 对 此 模型 进行 仔 
细 研 究 . 

我 们 通过 考虑 如 下 两 个 美国 的 周 利率 序列 之 间 的 关系 来 介绍 该 模型 . 

e ru: 一 年 期 固定 期 限 国库 券 利率 . 

e rs: 三 年 期 固定 期 限 国 库 券 利率 . 

这 两 个 序列 都 以 百分数 给 出 , 观测 时 间 都 是 从 1962 年 1 月 4 日 至 1999 年 9 月 10 
日 , 都 有 1967 个 观察 值 , 并 且 是 从 圣 - 路 易 斯 联邦 储备 银行 得 到 的 . 严格 来 讲 , 应 
该 利用 第 8 章 中 的 多 元 时 间 序 列 分 析 对 这 两 个 利率 序列 联合 建 模 . 然而 , 为 了 简单 
起 见 , 我 们 将 注意 力 放 在 回归 类 型 的 分 析 上 , 并 月 忽略 它们 的 同时 性 ， 

图 2-17 是 上 述 两 个 利率 序列 的 时 间 图 , 实 线 是 一 年 期 的 利率 , 虚线 是 三 年 期 的 
利率 . 图 2-18a 是 ri 对 ra 的 散 点 图 , 正好 与 预期 的 一 样 , 这 两 种 利率 是 高 度 相 关 的 . 
描述 这 两 种 利率 之 间 的 关系 的 一 个 自然 方式 是 利用 简单 的 模型 T3t = a+ Brit + et, 
所 拟 合 的 模型 是 

rat = 0.911 + 0.924rit | ce, Ge = 0.538, (2.44) 
其 中 R? = 95.8%, 两 个 系数 的 标准 误差 分 别 为 0.032 和 0.004. 模型 (2.44) 证 实 
了 两 种 利率 之 间 的 高 度 相 关 性 . 然而 , 由 图 2-19 Pras A Ae AY AY 8] FR A y 
差 的 ACF 可 见 ， 该 模型 是 严重 地 不 充分 的 .特刊 地 , 残 差 的 样本 ACF 是 高 度 显 
著 的 并 且 缓 慢 衰 减 , 显示 出 单位 根 非 平稳 时 间 序 列 的 特点 . 残 差 的 表现 说 明 两 种 利 
率 间 存 在 明显 的 差异 . 利用 现代 经 济 计量 方法 , 如 果 我 们 假定 两 个 利率 序列 都 是 单 
位 根 非 平稳 的 , 那么 (2.44) 式 中 残 差 的 表现 说 明 这 两 种 利率 序列 不 是 协 整 的 (co- 
integrated)(J,28 8 章 中 关于 协 整 的 讨论 ). 换言之 , 数据 不 支持 关于 两 种 利率 间 存 
在 长 期 均衡 关系 的 假设 .从 某 种 意义 上 讲 , 这 并 不 让 人 感到 意外 , 因为 “ 逆 收 益 曲 
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线 "(inverted yield curve) 在 数据 所 在 的 时 间 段 内 出 现 了 .“ 首 收益 曲线 ” 指 的 是 利 
率 与 它们 离 到 期 日 的 时 间 长 短 道 相关. 


1970 1980 1990 2000 
年 


图 2-17 从 1962 年 1 月 4 日 到 1999 年 9 月 10 日 美国 周 利 率 (百分比 ) 的 时 间 图 . 实 线 是 一 
年 期 固定 期 限 国库 券 利率 , 虚线 是 三 年 期 固定 期 限 国库 券 利率 


(a) (b) 


年 期 利率 的 变化 量 


F—1—E e. 
4 6 S8 10 12 14 16 —1.5—1.0 —0.5 0.0 0,51.0 1.6 


-年 期 一 年 期 利率 变化 基 


图 2-18 从 1962 年 1 月 5 日 到 1999 年 9 月 10 日 美国 周 利率 的 散 点 图 : (a) 三 年 期 对 一 年 
期 ;(b) 三 年 期 利率 的 变化 量 对 一 年 期 利率 的 变化 量 


两 个 利率 序列 和 (2.44) 式 中 的 残 差 的 单位 根 非 平稳 性 使 我 们 想到 了 考虑 利率 
变化 量 序列 ， 


令 
(1) e — ru — r14-1— (1— B)ri,. t22: 一 年 期 利率 的 变化 量 ; 
(2) cat = rs 一 ?at 一 (1 一 B)rsat，t>2: 三 年 期 利率 的 变化 量 ， 
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图 2-19 两 种 美国 周 利率 的 线性 回归 (2.44) 式 的 残 差 序列 : (a) 时 间 图 ; (b) 样本 ACP 
并 考虑 线性 回归 es = a+ Bert 十 et 图 2-20 所 示 的 是 两 个 变化 量 序列 的 时 间 图 ， 


而 图 2-18b 所 示 的 是 它们 之 间 的 散 点 图 . 这 两 个 变化 序列 仍然 是 高 度 相 关 的 , 为 它 
们 拟 合 的 线性 回归 模型 为 


Ca, = 0.000 24- 0.781 lct 十 et， 6, = 0.068 2, (2.45) 

(a) 
2 
db 1 
33 0 
A j 
一 2 

1970 1980 1990 2000 
年 

(b) 
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年 
图 2-20 从 1962 年 1 月 12 日 到 1999 年 9 月 10 日 美国 周 利率 变化 量 序 列 的 时 间 图 : 
(a) 一 年 期 固定 期 限 国库 券 利 率 的 变化 ; (b) 三 年 期 固定 期 限 国库 券 利率 的 变化 
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其 中 m? = 84.896, 两 个 系数 的 标准 误差 分 别 是 0.001 5 和 0.007 5. 此 模型 进一步 证 
实 了 两 种 利率 间 很 强 的 线性 相关 性 . 图 2-21 给 出 了 (2.45) 式 的 残 差 的 时 间 图 和 样 
本 ACF, 这 个 样本 ACE 又 表明 残 差 中 有 一 些 显著 的 序列 相关 性 , 但 相关 系数 的 绝 
对 值 要 小 得 多 . 残 差 的 这 种 弱 序 列 相关 性 能 用 前 面 几 节 中 讨论 的 简单 时 间 序 列 模 
型 来 描述 , 从 而 得 到 一 个 带 时 间 序 列 误差 的 线性 回归 ， 
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图 2-21 ”两 种 美国 周 利率 变化 的 线性 回归 (2.45) 式 的 残 差 序 列 : (a) 时 间 图 ; (b) 样本 ACF 


本 节 的 主要 任务 是 讨论 一 个 简单 方法 来 建立 带 时 间 序 列 误差 的 线性 回归 模型 . 
这 种 方法 是 直接 的 ,我 们 对 残 差 序列 选用 一 个 本 章 所 讨论 过 的 简单 时 间 序 列 模型 ， 
然后 把 整个 模型 联合 估计 出 来 .作为 说 明 , 考虑 (2.45) 式 中 的 简单 线性 回归 . 
为 模型 的 残 差 是 序列 相关 的 , 所 以 我 们 给 残 差 识别 一 个 简单 的 ARMA 模型 .从 图 
2-21 的 样本 ACF 看 出 , MA(1) 模型 对 残 差 序列 是 适合 的 , 把 线性 回归 模型 修改 为 


C3t 一 人 十 有 ct 十 ct， Ct = Qt — 0184 1, (2.46) 


其 中 {a} 是 一 个 白 品 声 序列 . 换 句 话说 , 我 们 简单 地 用 不 带 常数 项 的 MA(1) 模型 
来 刻画 (2.45) 式 中 的 误差 项 的 序列 相关 性 .结果 得 到 的 模型 是 带 时 间 序 列 误差 的 
线性 回归 模型 的 简单 例子 . 在 实际 应 用 中 , 可 把 更 复杂 的 时 间 序 列 模型 加 到 线性 回 
归 方 程 上 去 , 形成 一 般 的 带 时 间 序 列 误差 的 回归 模型 . 

在 现代 计算 机 出 现 之 前 , 估计 带 时 间 序 列 误差 的 回归 模型 不 是 一 件 容 易 的 事 . 
人 们 提出 一 些 特殊 的 方法 , 如 Cochrane-Orcutt 估计 量 , 来 处 理 残 差 中 的 序列 相关 
性 ( 见 Greene(2000) 第 546 页 ). 但 现在 这 种 估计 与 其 他 时 间 序 列 模型 的 估计 一 样 
容易 . 若 所 用 的 时 间 序 列 模型 是 平稳 的 、 可 逆 的 , 则 可 用 最 大 似 然 法 把 模型 一 起 估 
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计 出 来 . 这 就 是 我 们 应 用 SCA 软件 包 所 采用 的 方法 . 对 美国 的 周 利率 数据 , 所 拟 
合 的 形 如 (2.46) 式 的 模型 为 


cat = 0.000 2 十 0.782 4ct + er, er =at +0.211 5a 1, Ga = 0.066 8, (2.47) 


其 中 R? = 85.4%, 参数 的 标准 误差 分 别 为 0.001 8, 0.007 7 和 0.022 1, 此 模型 不 再 
有 显著 的 间隔 为 1 的 残 差 ACK, 虽然 在 间隔 为 4 和 6 时 残 差 有 较 小 的 序列 相关 系 
数 , 但 是 , 如 果 在 残 差 方程 中 加 上 间隔 为 4 和 6 的 MA 系数 , 结果 的 改进 并 不 大 ， 
具体 细节 在 此 不 作 讨 论 . 

比较 (2.44) 式 、(2.45) 式 和 (2.47) 式 这 三 个 模型 , 我 们 观察 到 如 下 几 点 : 第 一 ， 
(2.44) 式 的 高 R? 和 系数 0.924 会 导致 人 们 的 错误 认识 , 因为 该 模型 的 残 差 有 强烈 
的 序列 相关 性 . 第 二 , 对 利率 变化 量 序列 , (2.45) 式 和 (2.47) 式 的 R? 和 cu 的 系数 
都 很 接近 , 这 说 明 对 这 个 具体 例子 来 说 , 对 变化 序列 加 上 一 个 MA(1) 模型 得 到 的 改 
进 不 大 . 这 并 不 出 人 意料 , 因为 估计 出 的 MA 系数 尽管 是 高 度 统 计 显 着 的 . (EAS 
是 较 大 的 数值 . 第 三 , 上述 分 析 表 明 在 线性 回归 分 析 中 检验 残 差 的 序列 相关 性 很 重 
要 . 

因为 (2.47) 式 中 的 常数 项 不 显著 , 该 模型 表明 前 述 两 个 周 利率 序列 有 如 下 关 
f: 

rae = T34—1 + 0.782 (rie — 714-1) 十 Qt + 0.212a,. 1. 
这 两 种 利率 是 相互 影响 并 序列 相关 的 . 

小 结 

我 们 给 出 分 析 带 时 间 序 列 误差 的 线性 回归 模型 的 一 般 步 又 : 

(1) 拟 合 一 个 线性 回归 模型 并 检验 其 残 差 的 序列 相关 性 ; 

(2) 如 果 残 差 序列 是 单位 根 非 平稳 的 , 则 对 因 变 量 和 自 变量 都 作 一 阶 差分 . 然 
后 对 两 个 差分 后 的 序列 进行 第 (1) 步 . 车 这 时 的 残 差 序列 是 平稳 的 , 则 对 残 差 识别 
一 个 ARMA 模型 并 相应 地 修改 线性 回归 模型 . 

(3) 用 最 大 似 然 法 进行 联合 估计 , 并 对 模型 进行 检验 看 一 看 是 否 需 要 进一步 改 
进 . 

为 检验 残 差 的 序列 相关 性 , 我 们 推荐 使 用 Ljung-Dox 统计 量 , 而 不 是 Durbin- 
Watson(DW) 统计 量 , 因为 后 者 只 考虑 间隔 为 1 的 序列 相关 性 . 有 时 残 差 的 序列 相 
关 性 表现 在 高 阶 间隔 上 , 尤其 是 在 所 涉及 的 时 间 序 列 呈 现 某 种 季节 性 的 时 候 . 

EH: KARZAI et 的 工 个 观察 值 , Durbin-Watson 统计 量 是 


ST lamaa 
aa M LA 
> ez 


直接 计算 表明 DW z 2(1— fi), 其 中 Pi 是 {er} 的 间隔 为 1 的 ACF. 


DW = 
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在 S-Plus 中 可 以 用 命令 OLS( 普 通 最 小 二 乘 ) 来 分 析 带 时 间 序 列 误差 的 回归 
模型 , 该 命令 假定 残 差 服从 AR 模型 . 为 了 识别 延迟 变量 , 可 以 用 命令 tslag, 例如 
y —tslag(r.1) 下 面 给 出 了 关于 利率 序列 的 相关 命令 , 这 里 加 表示 对 命令 的 注释 . 


oO 
> da-matrix(scan(file-'w-gs1n36299.txt'),3) %tload data 
> rlt=da[1,] 
> r3t=da[2,] 
> fit-OLS(r3t-ri1t) % fit the first regression 
> summary (fit) 
> c3t-diff(r3t) % take difference 
> Clt=diff (rit) 
> £itl=OLS(c3t~clt) % fit second regression 
> summary (fiti) 
> fit2=OLS (c3t~clt+tslag(c3t,1)+tslag(clt,1), na.rm=T) 
> summary (fit2) 


为 得 到 更 多 的 信息 参见 2.10 节 的 输出 结果 . 


2.10 协 方差 矩阵 的 相合 估计 


仍然 考虑 (2.43) 式 给 出 回归 模型 . 可 能 存在 这 样 的 情形 : 误差 项 et 存在 序列 
相关 性 或 条 件 异 方差 性 , 然而 我 们 分 析 的 目标 却 是 关于 回归 系数 a 和 B 做 推断 . 对 
条 件 异 方差 性 的 讨论 参见 第 3 章 . 在 系数 的 最 小 一 乘 估计 仍然 是 相合 估计 的 情形 
下, 已 经 有 方法 给 出 系数 协 方差 矩阵 的 相合 估计 , 应 用 比较 广泛 的 有 两 种 方法 . 第 
一 种 方法 称 为 异 方差 相合 (HC) 估计 , 参见 Eicker(1967) 和 White(1980). 第 二 种 方 
法 称 为 异 方差 及 自 相 关 相 合 (HAC) 估计 , 参见 Newey 和 West(1987). 

为 了 容易 讨论 , 我 们 将 回归 模型 改写 为 


Ye = DB F et, t= |, 4. 7, (2.48) 


其 中 y, 是 因 变 量 , m, = (z14,… ora)! 是 由 包含 常数 项 在 内 的 自 变 量 所 构成 的 人 上 维 
向 量 , 8 = (bre , Pk)' 是 参数 向 量 . 这 里 c 表示 向 量 c 的 转 置 . B 的 最 小 二 乘 佑 
计 以 及 与 之 相关 的 协 方差 第 阵 的 估计 分 别 为 


T -1 T T x 
p= [Sza] PET ed P» | 
t=1 i1 


ti 
其 中 o? 是 e, 的 方差 , 可 以 用 回归 残 差 的 方差 来 估计 . 当 存 在 序列 相关 性 或 条 件 异 
方差 性 时 , 前 面 的 协 方差 阵 估计 不 再 是 相合 的 , 这 经 常会 导致 B 的 t- ERA. 
White(1980) 的 估计 是 


E T T - 
; P E. 
Cov(B)uc = bs z d bs 2 -= (845 


t=1 tl 
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HP ê, = yi 一 v 是 + 时 刻 的 残 差 . Newey 和 West(1987) 给 出 的 估计 是 


T 一 T —1 
Cov(B)nac = B = Char > d : (2.50) 
t=1 


fiel 
其 中 
Cuac = = Da 十 Ye $7 (Terex mp. Ms Dj jE) 
t=j+1 
这 里 | 是 截断 参数 ,ui er 例如 它 可 以 是 如 下 定义 的 Bartlett 权重 函数 
Jj 
uw —1-— P+1' 
也 可 以 用 其 他 的 权重 函数 ， Newey 和 West 建议 1 取 4(T/100)?/9 的 整 部 . 该 估计 本 
质 上 是 用 非 参 数 的 方法 来 估计 aizt} 的 协 方差 阵 . 


作为 说 明 , 我 们 在 (2.45) 式 中 应 用 利率 的 一 阶 差分 序列 . 如 果 忽 略 残 差 中 的 序 
列 相关 性 和 异 方差 性 , 则 oo, 系数 的 t- 比 是 104.63; 如 果 用 HC 估计 的 话 , ix t- 比 
变 为 46.73; WRH HAC 估计 , 则 该 t- 比 减少 为 40.08. 下 面 我 们 用 S-Plus 来 演示 
回归 的 过 程 . 考虑 到 残 差 的 序列 相关 性 , 回归 中 用 了 延迟 值 014a 和 cay 作为 回 
KAF. 
S-Plus 演示 


% 表 示 注 释 . 

> x=matrix(scan(lfile=’w-gs1n36299.txt'),3) % Load data 
> gsl-x[1,] $ 1-year interest rate 

> gs3=x[2,] $ 3-year interest rate 


> dgs3=diff (gs3) 
> dgsl=diff (gs1) 


> reg.fit-OLS(dgs3-dgsl) % Fit a simple linear regression 
> summary (reg.fit) 


Call: 
OLS (formula = dgs3 ~ dgs1) 


Residuals: 
Min 1Q Median 3Q Max 
-0.3806 -0.0334 -0.0005 0.0344 0.4742 


Coefficients: 
Value Std. Error t value Pr(>|t|) 
(Intercept) 0.0002 0.0015 0.1609 0.8722 
dgsl 0.7811 0.0075 104.6283 0.0000 


Regression Diagnostics: 
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R-Squared 0.8479 
Adjusted R-Squared 0.8478 
Durbin-Watson Stat 1.6158 
> summary (reg.fit,correction="white") % Use HC estimator 


Coefficients: 
Value Std. Error t value Pr(»|t|) 
(Intercept) 0.0002 20.0015 0.1609 0.8722 
dg51 0.7811 0.0167 46.7260 0,0000 


> summary (reg.fit,correction="nw") % Use HAC estimator 


Coefficients: 
Value Std. Error t value Pr(»|t|) 
(Intercept) 0.0002 0.0017 0.1436 0.8858 
dgsi 0.7811 0.0195 40.0841 0.0000 


% Below, fit a regression model with time series error 
> reg.ts=OLS (dgs3~dgsl+tslag(dgs3,1)+tslag(dgsl1,1),na.rm=T) 


> summary (reg.ts) 


Call: 
OLS (formula = dgs3-dasi«tslag(dgs3,1)*tslag(dgsi1,1), ma.rm= T) 
Residuals: 

Min 1Q Median 3Q Max 


-0.3652 -0.0329 -0.0005 0.0333 0.4506 


Coefficients: 
Value Std. Error t value Pr(»|t|) 
(Intercept) 0.0002 0.0015 0.1426 0.8866 
dgs1 0.7851 0.0078 100.4694 0.0000 
tslag(dgs3, 1) 0,1920 0.0221 8.6685 0.0000 
tslag(dgsl, 1) -0.1634 0.0190 -8.6219 0.0000 


Regression Diagnostics: 
R-Squared C.8537 

Adjusted R-Squared 0.8535 

Durbin-Watson Stat 1.9740 


2.11 长 记忆 模型 


我 们 已 经 讨论 过 , 平稳 序列 的 ACE 在 间隔 增加 时 呈 指 数 速度 衰减 . 但 是 , 对 
单位 根 非 平稳 时 间 序 列 , 可 以 证 明 : 对 任意 固定 的 间隔 , 当 样 本 容量 增加 时 . 样本 
ACE 收敛 于 1( 见 Chan 和 Wei(1988) 以 及 Tiao 和 Tsay(1983)). 有 些 时 间 序 列 的 
ACF 随 间 隔 的 增加 以 多 项 式 的 速度 缓慢 衰减 到 0, 这 样 的 过 程 称 为 长 记忆 时 间 序 
列 . 长 记忆 序列 的 一 个 例子 就 是 如 下 定义 的 分 数 差分 序列 : 


O= Bz,—-a, —05<d<0.5, (2.51) 


78 第 2 章 线性 时 间 序 列 分 析 及 其 应 用 


其 中 {ar} 是 一 个 白 噪 声 序列 ， 模 型 (2.51) 的 性 质 已 在 文献 中 得 到 广泛 的 研究 (如 
Hosking(1981)). 我 们 把 它 的 一 些 性 质 综述 如 下 . 
(1) 若 d < 0.5, W z, 是 弱 平 稳 过 程 并 有 无 穷 阶 MA 表示 : 


oo 
Tt = a+ > ViQ—i, 


í-l 


其 中 


k! k!(d— 1)! ` 
(2) 4$ d » —0.5, W z, 是 可 逆 的 并 有 无 穷 阶 AR 表示 : 


juo SOTD id) _ (k+d- 1)! 
lI —MÉÉ—Ó— M WEE 


De 
Tt = > TiTi—-i d- Q4, 
$21 


idi -d(-d)..(k-1—d) _ (k~d~1)! 


k! ~ M(-4-— 1r 
(3) 对 —0.5 < d < 0.5, z, 的 ACE 为 


ti = 


| d(i+d)---(k-—1+d) 
P = üa-d)2-d)---(k-dy 


特别 地 , pi 一 d/ (1 — d), 且 当 大 一 = 时 


k=1, 9s., 


Pk © aie. 
(4) 对 —0.5 < d < 0.5, z, 的 偏 自 相关 函数 (PACF) A den = d/(k — d), 
一 1.2,….， 
(5) 对 一 0.5 < d < 0.5, z, 的 谱 密度 函数 f (w)( 它 是 c, 的 ACE 的 傅 里 叶 变 换 ) 
满足 


Fl w+, (2.52) 


其 中 w e [0, 27) 表示 频率 . 

当 < 0.5 Bf, 我 们 对 zw 的 ACF 的 性 质 特 别 感 兴趣 . 这 条 性 质 表 明 pe ~ 
cki, 以 多 项 式 速度 衰减 , 而 不 以 指数 速度 衰减 . 正 因为 这 个 原因 , 这 样 的 x, 过 
程 称 为 长 记忆 时 间 序 列 . (2.52) 式 中 谱 密 度 的 特殊 特征 是 当 w 一 0 时 谱 发 散 到 无 
穷 , 而 平稳 ARMA 过 程 的 谱 密度 函数 对 w [0,20] 是 有 界 的 . 

前 面 我 们 用 到 了 非 整 数 寡 的 二 项 式 展开 ， 


> d d —]1 fd —£ 
a-a*-Yc»( ) Bs (i)a en, 


k=0 
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若 分 数 差 分 序列 (1 一 B)" zi 服从 一 个 ARMA(p, q) 模型 , 则 称 re 为 一 个 ARFIMA 
(p, d , g) 过 程 , EH ARIMA 模型 的 推广 , 这 里 允许 d 为 非 整 数 . 

在 实际 中 , 如 果 一 个 时 间 序 列 的 样本 ACE 在 数值 上 不 大 , 但 衰减 得 很 慢 , 则 该 
序列 就 可 能 会 有 长 记忆 性 . 作为 说 明 , 图 2-22 所 示 的 是 1962 年 7 月 3 日 至 1997 
年 12 月 31 日 的 CRSP 价值 加 权 指 数 和 等 权重 指数 的 日 简单 收益 率 的 绝对 值 序列 
的 样本 ACF fH. 可 见 ACF 的 数值 相对 较 小 , 但 衰减 很 慢 , 甚至 在 间隔 为 300 以 后 
还 在 5%% 的 水 平 下 是 显著 的 . 对 绝对 值 收益 率 序列 的 样本 ACF 的 表现 , 更 多 的 讨论 


(a) 


ACF 


ACF 


0 100 200 300 400 


图 2-22 CRSP 价值 加 权 指 数 和 等 权重 指数 的 日 简单 收益 率 的 绝对 值 序列 的 样本 ACF: 
(a) 价值 加 权 指 数 收益 率 的 绝对 值 序列 的 ACF; (b) 等 权重 指数 收益 率 的 绝对 值 序 
列 的 ACK. 时 间 区 间 是 从 1962 年 7 月 3 日 到 1997 年 12 月 31 日 


参见 Ding, Granger 和 Engle(1993). 对 (2.51) 式 中 的 纯 分 数 差分 模型 , 我 们 可 以 用 
最 大 似 然 法 或 带 低频 对 数 周 期 图 的 回归 方法 米 估 计 d. 长 记忆 模型 在 金融 文献 中 受 
到 关注 , 部 分 的 原因 是 在 连续 时 间 模 型 中 关于 分 形 布朗 运动 的 工作 . 


附录 一些 SCA 的 命令 


2.4 节 中 使 用 的 命令 


数据 文件 是 m-vw.txt, 符号 “一 ”后 为 注释 , 这 些 注释 解释 的 是 每 个 命令 的 苹 
Hi. 


- load dara into SCA and denote the series by vw. 
input vw. file 'm-vw.txt' 
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-- compute 10 lags of PACF. 

pacf vw. maxl 10. 

-- compute AIC for AR(1) to AR(10). 

miden vw. no ccm. arfits 1 to 10. 

-- specify an AR(3) model and denote the model by ml. 
tsm ml. model (1,2,3)vw-cO«noise. 

-- estimate the model and store the residuals in rl. 
estim mi. hold resi (rl) 

-- compute ACF of the residuals, including Q statistics. 
act ril. 

-- refine the model to an AR(5). 

tsm ml. model (1,2,3,4,5)vw=cO+noise. 

-- estimate the model and store the residuals in ri. 
estim ml. hold resi {r1) 

-- compute ACF of the residuals. 

acf ri. maxi IG. 

-- compute p-value of the Q(5) statistic. 
pz1.0-cdfcí(11.2,5) 

-- print p-value. 

print p 

-- re-estimate the model using the first 858 observations. 
estim ml. span 1,858. 

-- compute l-step to 6-step ahead forecasts at origin 858. 
ufore ml. orig 858. nofs 6, 

-- quit SCA. 

stop 


2.9 节 中 使 用 的 命令 
一 年 期 限 利率 在 文件 “wgsliyr.txt?” "P, 三 年 期 利率 在 文件 “wgs3yr. txt" P. 


-- load data into SCA, denote the data by ratel and rate3. 
input date, ratel. file 'wgslyr.txt' 

input date,rate3. file 'wgs3yr.txt' 

-- specify a simple linear regression model. 


tsm ml. model rate3=b0+(b1)ratel+noise. 
-- estimate the specified model and store residual in rl. 


estim ml. hold resi(rl). 

-- compute 10 lags of residual acf. 

acf rl. maxl 10. 

--difference the series & denote the new ones by clt and c3t 
diff old ratel,rate3. new clt, c3t. compress. 

--specify a linear regression model for the differenced data 
tsm m2. model c3t=h0+(h1)clt+noise. 

-- estimation 


estim m2. hold resiir2). 
-- compute residual acf. 


acf r2. maxl 10. 


2.1 


2.2 


2.3 


2.4 


2.5 
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-- specify a regression model with time series errors. 
tsm m3. model c3t-g0-«(gi)c1t«(1)noise. 

-- egtimate the model using the exact likelihood method. 
estim m3. method exact. hold resi(r3). 

-- compute residual acf. 

acf r3. maxl 10. 

-- refine the model to include more MA lags. 

tsm m4. model c3t-g0-«(gl1)cit«(1,4,6)noise. 

-- estimation 

estim m4. method exact. hold resi(r4). 

-- compute residual acf. 

acf r4. maxl 10. 

-- exit SCA 

stop 


练 > 题 


除非 特别 声明 , 在 以 下 习题 中 都 用 5%% 的 显著 性 水 平 来 得 出 结论 . 
假定 一 个 债券 指数 的 月 简单 收 荔 率 服从 如 下 MA(1) 模型 : 


R: = at + 0.2at-1, Ga = 0.025. 


假设 aioo = 0.01. 计算 该 收益 率 以 == 100 为 预测 原点 的 向 前 1 步 和 向 前 2 步 的 预测 . 
预测 误差 的 标准 差分 别 是 多 少 ? 计算 该 收益 率 序列 的 间隔 为 1 和 间隔 为 2 的 自 相关 系数 . 
假定 一 个 证 券 的 日 对 数 收益 率 服从 模型 


re = 0.01 4- 0.2ri—2 + at; 


其 中 {ae} 是 均值 为 0、 方差 为 0.02 的 高 斯 白 噪 声 序列 . 收益 率 序 列 {ri} 的 均值 和 方差 

是 多 少 ? 计算 rt 的 间隔 为 1 和 间隔 为 2 的 自 相 关系 数 . 假设 rioo = —0.01, ros = 0.02 

计算 该 收益 率 序列 以 t= 100 为 预测 原点 的 向 前 1 步 和 向 前 2 步 的 预测 . 预测 误差 的 标 

准 差 分 别 是 多 少 ? 

考虑 美国 从 1951 年 1 月 到 2004 年 2 月 的 月 失业 举 , 数据 包含 在 文件 ‘‘m-unemhelp.txt”? 

H. 数据 已 经 经 过 季节 调整 , KAE- 路 易 斯 联邦 储备 银行 为 该 序列 建立 一 个 时 间 序 列 

BUS. 并 用 该 模型 预测 2004 年 3 月 、4 月 和 5 月 的 失业 率 . 进一步 , 如 果 存 在 周期 环 , VE 

算 其 周期 . (注意 , 适合 该 数据 的 模型 不 只 一 个 , 只 要 模型 是 充分 的 即 可 . ) 

考虑 基于 市 场 资 本 化 的 纽约 证 券 交 易 所 、 美国 证 券 交 易 所 和 纳 斯 达 克 证 券 交 易 所 中 Decile 

1, Decile 5 和 Decile 10 的 简单 月 收益 率 . 数据 的 时 间 区 间 是 从 1960 年 1 月 到 2003 年 

12 H, 数据 来 自 CRSP. 

(a) 对 每 个 收益 序列 , 在 5% 的 显著 性 水 平 下 检验 如 下 原 假设 : 前 12 个 间隔 的 自 相 关系 
数 全 为 0, 并 得 出 结论 . 

(b) 为 Decile 5 序列 建立 AR 模型 和 MA BUS. 

(c) 用 所 建立 的 AR 模型 和 MA 模型 对 序列 进行 向 前 1 步 到 向 前 3 步 预测 . 

考虑 IBM 股票 从 1962 年 到 2002 年 的 日 简单 收益 率 , 数据 包含 在 文件 ‘‘d-ibmvwew6202. 

txt2 中 . 计算 IBM 股票 日 简单 收益 率 绝对 值 序列 的 前 100 个 间隔 的 样本 ACF. 存在 长 

范围 相依 的 证 据 吗 ? 为 什么 ? 
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2.9 


2.14 
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考虑 美国 制造 业 的 用 电 需 求 . 数据 是 取 对 数 后 的 , 表示 每 个 月 中 固定 某 天 的 需求 , 包含 在 

数据 文件 “ “power6.txt? 中 ， 对 序列 建立 时 间 序 列 模型 ,并 用 所 拟 合 的 模型 进行 向 前 1 

步 到 向 前 24 步 预测 . 

再 考虑 CRSP 等 权重 指数 (包含 分 布 ) 从 1980 年 1 月 到 1999 年 12 月 的 日 简单 收益 率 ， 

数据 包含 在 文件 ‘‘d-ew8099.txt* 中. 代表 星期 一 、 星 期 二 、 星期 三 和 星期 四 的 指示 变量 

存储 在 文件 “wkdays8099.txt?) :的 前 四 列 . 用 一 个 回归 模型 来 研究 指数 收益 率 的 交易 日 

效应 . 所 拟 合 的 模型 是 什么 ? 对 于 该 序列 , 周末 效应 在 5 多 的 显著 性 水 半 下 时 著 吗 ? 用 协 方 

差 阵 的 HAC 估计 来 计算 司 归 估计 的 本 bb. 这 会 改变 周 未 效应 检验 的 结论 吗 ? 残 差 中 存 

在 序列 相关 性 吗 ? 如 果 存 在 序列 相关 性 , 建立 带 时 间 序 列 误差 的 模型 来 研究 周末 效应 . 

由 上 一 个 练习 知 等 权重 指数 的 日 收益 率 存 在 一 些 周末 效应 , 那么 S&P500 综合 指数 存在 

周末 效应 吗 ? 为 回答 该 问题 , 考虑 从 2000 年 1 月 3 日 到 2003 年 12 A 31 AY S&P500 

综合 指数 的 日 收益 率 , 数据 包含 在 文件 “da-del13dx0003 .txt2” 中 ,该 文件 有 12 列 . 前 四 

列 分 别 是 Dell, vw, ew, 和 sp 的 日 收益 率 , 第 5~9 列 分 别 是 周一 到 周 五 的 指示 变量 .第 

10~12 列 分 别 表示 年 、 月 , 日. 共有 1004 个 数据 点 ,所 有 的 检验 都 在 5% 的 显著 性 水 平 

下 进行 , 回答 下 述 问 题 : 

(a) S&P500 综合 指数 的 日 简单 收益 率 存在 星期 五 效应 吗 ? 你 可 以 用 一 个 简单 的 线性 回归 
模型 来 回答 该 问题 . 估计 模型 , 并 检验 不 存在 星期 五 效应 的 原 假设 , 得 出 你 的 结论 . 

(b) 用 Q(12) 统计 量 来 检验 残 差 的 序列 相关 性 . 残 差 中 存在 显著 的 序列 相关 性 吗 ? 

对 单个 股票 收益 率 考虑 与 上 题 中 类 似 的 问题 . 在 该 题 中 , 我 们 采用 Dell 股票 的 日 简单 收益 

率 . 

(a) Dell 股票 的 日 简单 收益 率 存 在 星期 五 效应 吗 ? 估计 模型 , 并 检验 不 存在 星期 五 效应 的 
原 假设 , 得 出 你 的 结论 . 

(b) 残 差 中 存在 序列 相关 性 吗 ? 用 Q(12) 统计 量 进 行 检验 , 并 得 出 你 的 结论 . 

(c) 用 带 时 间 序 列 误差 的 回归 模型 对 上 述 模型 进行 改进 . 基于 改进 后 的 模型 , 存在 显著 的 
星期 五 效应 吗 ? 

考虑 穆 迪 公司 发 售 的 AAA 和 BAA 优质 债券 从 1919 年 1 月 到 2004 年 3 AMAR 

T]. BRAK . 足 易 斯 联邦 储备 银行 . 月 春 利 是 日 极 利 的 平均 值 . 计算 这 两 个 收益 率 序 

列 的 概括 性 统计 最 (样本 均值 、 样本 标准 差 、 样本 斜 度 、 样 本 超额 峰 度 , 最 大 值 , 最 小 值 ). 

债券 盘 利 是 偏 斜 的 吗 ? 它们 是 厚 尾 的 吗 ? 在 5% 的 显著 性 水 平 下 同 答 这 些 问题 . 

考虑 练习 2.10 中 的 AAA RA RA, 为 该 序列 建立 一 个 时 间 序 列 模型 . 

仍然 考虑 两 个 债券 序列 , 即 AAA 和 BAA. 这 两 个 序列 之 间 有 什么 关系 ? 为 回答 该 问题 

把 AAA 债券 的 莉 利 作为 因 变量 , 而 BAA 债券 的 盘 利 作为 自 变量 来 建立 时 间 序 列 模型 ， 

考虑 CRSP 等 权重 指数 的 月 对 数 收益 率 , 从 1962 年 1 月 到 1999 年 12 月 共 456 个 观察 

f&. 你 可 以 直接 从 CRSP 或 在 网 上 文件 ‘‘m-ew6299 .txt''! 中 得 到 数据 . 

(a) 给 该 序列 建立 一 个 AR BUS, 并 检验 所 拟 合 的 模型 . 

(b) 给 该 序 州 建立 一 个 MA TRA, 并 检验 所 所 合 的 模型 . 

(c) 用 前 两 问 中 所 建 的 AR 和 MA 模型 计算 向 前 1 步 和 2 步 预测 . 

(d) 比较 所 拟 合 的 AR 和 MA 模型 . 

考虑 S&P500 指数 的 现价 与 期 货 价 的 动态 关系 . 数据 文件 “sp5may.dat 有 三 列 : 期 货 

价 的 对 数 . 现价 的 对 数 和 交易 成 本 (cost-of-carry)(< 100), 数据 是 来 自 芝 加 哥 商 品 交易 所 
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(Chicago Mercantile Exchange) 的 1993 年 5 月 的 S&P500 指数 及 其 6 月 的 期 货 合 约 ， 
时 间 间 隔 为 1 分 钟 (一 天 内 ). 有 些 作 者 利用 此 数据 来 研究 指数 期 货 的 套利 机 会 . 这 里 我 们 
把 注意 力 放 在 前 两 列 上 . 设 fi 和 st 分 别 是 期 货 价 和 现价 的 对 数 . 考虑 y, = fe foi A 
Te = St — St-14 设 Ut 为 因 变量 ， 建立 {ue} 和 {xr} 间 带 时 间 序 列 误差 的 回归 模型 . 

2.15 每 季度 国民 生产 总 值 的 隐 性 通货 紧缩 指数 (gross domestic product implicit price defla- 
tor) 通常 用 来 度量 通货 膨胀 . 文件 ‘'q-gdpdef dat’ ta SRM 1947 年 第 一 季度 到 
2004 年 第 一 季度 的 此 数据 . 数据 格式 是 年 、 月 和 通货 紧缩 指数 . 该 数据 是 经 过 季节 性 调整 
的 , 2000 年 时 的 数值 为 100. 对 该 序列 建立 一 个 ARIMA 模型 , 并 检验 所 拟 合 的 模型 的 有 
效 性 . 数据 是 从 圣路易斯 联邦 储备 银行 得 到 的 . 
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第 3 章 ”条 件 异 方差 模型 


本 章 的 日 标 是 研究 一 些 在 文献 中 用 来 给 资产 收益 率 的 波动 率 建 模 的 统计 方法 
和 计量 经 济 模型 . 称 这 些 模型 为 条 件 异 方差 模型 . 

波动 率 在 期 权 交易 中 是 一 个 重要 因素 , 它 是 标的 资产 收益 率 的 条 件 标准 差 . 例 
如 , 考虑 一 个 欧式 看 涨 期 权 的 价 人 恪 . 欧式 看 涨 期 权 是 一 个 合同 , 它 给 持 有 者 一 个 权 
TJ, 可 以 在 将 米 给 定 日 期 以 固定 的 价格 购买 固定 数量 的 一 个 具体 股票 的 股份 ， 持 
有 者 在 对 自己 不 利 的 情况 可 以 不 执行 购买 ， 这 个 固定 的 价格 叫做 项 定价 格 (strike 
price), 通常 记 为 K. 给 定 的 日 期 叫做 到 期 日 . 这 里 重要 的 是 距离 到 期 日 的 时 间 长 
E, 记 为 1. 著名 的 Black-Scholes 期 权 定 价 公 式 表 明 一 个 欧式 看 涨 期 权 的 价格 是 


In (Pi Kr) 
evil 


其 中 P, 是 标的 股票 的 现价 , r 是 无 风险 利率 , o, 是 该 股票 对 数 收益 率 的 条 件 标准 
25, b (z) 是 标准 正 态 随机 变量 的 累积 分 布 函数 在 x 点 的 值 . 此 公式 的 推导 将 在 第 
6 章 给 出 . 对 这 个 公式 有 几 个 精彩 的 解释 , 但 在 这 里 只 要 明白 标的 资产 对 数 收益 率 
的 条 件 标准 差 o, 在 其 中 起 重要 作用 这 一 点 就 够 了 . 这 个 波动 率 随时 间 变 化 , 并 且 
将 是 本 章 主要 讨论 的 问题 . 如 果 持 有 人 能 在 到 期 日 或 者 在 到 期 日 之 前 任何 时 刻 执行 
他 的 权利 , 那么 这 种 期 权 叫 做 美式 看 涨 期 权 . 

波动 率 在 许多 其 他 金融 方面 也 有 应 用 . 如 第 7 章 的 讨论 , 波动 率 的 建 模 提供 了 
一 个 简单 方法 来 计算 风险 管理 中 一 个 金融 头寸 的 风险 值 . 对 于 均值 -方差 框架 下 的 
资产 配置 , 波动 率 也 起 了 重要 作用 . 进一步 , 一 个 时 间 序 列 波 动 率 的 建 模 能 改进 参 
数 估计 的 有 效 性 和 区 间 预 测 的 精确 度 . 最 后 , 市 场 的 波动 率 指数 最 近 已 经 成 为 一 种 
金融 工具 . 由 芝加哥 期 权 交 易 所 (Chicago Board of Option Exchange, CBOE) 编制 
的 VIX 波动 率 指数 已 经 于 2004 年 3 月 26 日 进行 期 货 交易 . 

本 章 讨论 的 一 元 波动 率 模型 包括 Engle(1982) 提出 的 自 回 归 条 件 异 方差 (au- 
toregressive conditional heteroscedastic, ARCH) 异型 ，Bollerslev(1986) 提出 的 推 
广 的 自 回归 条 件 异 方差 模型 (GARCH), Nelson(1991) 提出 的 指数 GARCH 模型 
(EGARCH)，Tsay(1987) 提出 的 条 件 异 方差 自 回 归 清 动 平 均 (CHARMA) 模型 ， 
Nicholls 和 Quinn (1982) 提出 的 随机 系数 自 回 归 (RCA) #4, Melino 和 Turn- 
bull(1990), Taylor(1994), Harvey, Ruiz 和 Shephard(1994), 以 及 Jacquier, Polson 和 
Rossi(1994) 分 别提 出 的 随机 波动 率 (Stochastic Volatility, SV) 模型 . 我 们 还 讨论 了 
各 个 波动 率 模型 的 优点 和 缺点 , 并 给 出 这 些 模型 的 一 些 应 用 . 多 元 波动 率 模型 , 包 


& = P,® (£) — Kr^'$ (x 一 evil) ; w= 十 Sav, (3.1) 
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括 那 些 具 有 时 变相 关系 数 的 模型 , 将 在 第 10 章 中 讨论 . 本 章 还 在 3.15 节 讨 论 了 波 
动 率 建 模 的 一 些 其 他 方法 , 包括 应 用 某 项 资产 的 最 高 价格 和 最 低 价格 . 


3.1 波动 率 的 特征 


股票 波动 率 的 一 个 特殊 性 是 它 不 能 被 直接 观测 . 例如 , 考虑 IBM 股票 的 日 对 
数 收益 率 . 因为 一 个 交易 日 只 有 一 个 观测 值 , 所 以 日 波动 率 不 能 从 收益 率 中 观测 出 
x. 如 果 可 以 得 到 -天 内 的 股票 数据 , 如 10 分 钟 的 收益 率 , 那么 我 们 可 估计 日 波动 
率 , 参见 3.15 节 . 然而 这 种 估计 的 准确 性 值得 仔细 研究 . 例如 , 股票 波动 率 包括 交 
易 日 内 波动 率 和 隔夜 波动 率 , 而 后 者 代表 不 同 交易 日 之 间 的 变化 . 高 频 交 易 日 内 收 
益 率 只 包含 隔夜 波动 率 很 有 限 的 信息 . 波动 率 的 不 可 观测 性 给 评价 条 件 异 方差 模型 
的 预测 表现 带 来 了 困难 . 我 们 将 在 后 面 章 节 中 讨论 这 一 问题 . 

在 期 权 市 场 上 , 如 果 我 们 接受 这 样 一 个 思想 : 期 权 的 价格 是 由 如 Black-Scholes 
公式 这 样 的 计量 经 济 模型 决定 的 , 那么 我 们 就 可 以 利用 期 权 的 价格 得 到 隐 含 波动 率 
(implied volatility)， 这 种 方法 往往 遭 到 批评 ,因为 使 用 的 具体 模型 ,要 基于 一 些 实 
际 可 能 不 成 立 的 假定 ， 例 如 , 由 一 个 欧式 看 涨 期 权 的 价格 , 我 们 能 利用 (3.1) 式 的 
Black-Scholes 公式 推导 出 条 件 标准 差 ct, 所 得 到 的 值 称 为 标的 股票 的 隐 含 波动 率 . 
然而 , 这 个 隐 含 波动 率 是 在 假定 标的 资产 的 价格 服从 几何 布朗 运动 时 得 到 的 , 它 可 
能 与 实际 的 波动 率 很 不 一 样 . 经 验 告诉 我 们 , 隐 含 波动 率 一 般 要 比 采 用 GARCH 类 
波动 率 模型 得 到 的 值 大 . 这 也 许 是 与 波动 率 的 风险 溢价 或 计算 日 收益 率 的 方法 有 
X. 艺 加 哥 期 权 交 易 所 的 VIX 波动 率 指数 是 隐 含 波动 率 指数 . 

虽然 波动 率 不 可 直接 观测 , 但 它 的 一 些 特征 在 资产 收益 率 序列 中 能 普遍 看 到 . 
第 一 , 存在 波动 率 聚集 (volatility cluster), 也 就 是 , 波动 率 可 能 是 在 一 些 时 间 段 
上 高 , 而 在 另 一 些 时 间 段 上 低 . 第 二 , 波动 率 以 连续 方式 随时 间 变 化 , 即 波动 率 跳跃 
是 很 少见 的 . 第 三 , 波动 率 不 发 散 到 无 穷 , 即 波动 率 在 固定 的 范围 内 变化 . 从 统计 
学 角度 说 , 这 意味 着 波动 率 往往 是 平稳 的 . 第 四 , 波动 率 对 价格 大 幅 上 天 和 价格 大 
幅 下 降 的 反应 不 同 , 这 种 现象 称 为 杠杆 效应 (leverage effect). 这 些 性 质 对 波动 率 
模型 的 发 展 起 着 重要 作用 . 一 些 波动 率 模型 主要 具体 针对 已 有 模型 在 刻画 上 述 这 
些 特征 上 的 弱点 而 提出 的 . 例如 , EGARCH 模型 就 是 为 了 刻画 波动 率 对 大 的 “ 正 ” 
和 “ 负 ” 资 产 收 益 率 的 不 对 称 性 而 提出 来 的 . 


3.2 ”模型 的 结构 


用 r 表示 某 项 资产 在 上 时 刻 的 对 数 收 益 率 . 波动 率 研究 的 基本 思想 是 , 序列 
(r4) 是 序列 不 相关 的 或 低 阶 序 列 相关 的 , 但 不 是 独立 的 . 作为 说 明 , 图 3-1 给 出 了 
Intel 公司 股票 从 1973 年 1 月 到 2003 年 12 月 的 月 对 数 收益 率 的 自 相 关 函 数 (ACF) 


3.2 ”模型 的 结构 87 


和 偏 自 相关 函数 (PACK). 图 3-1a 是 收益 率 的 样本 ACK, 显示 除了 在 滞后 为 7 时 有 
较 小 相关 性 之 外 没有 显著 的 序列 相关 性 . 图 3-1c 是 对 数 收益 率 的 绝对 值 序列 nu] 
的 样本 ACP, 而 图 3-1b 是 收益 率 平方 r2 的 样本 ACF, 这 两 幅 图 清楚 地 表明 月 收 
益 率 序列 不 是 独立 的 . 结合 上 述 三 个 图 形 , 收益 率 序 列 看 起 来 像 是 序列 不 相关 的 且 
不 是 独立 的 . 波动 率 模型 就 试图 去 刻画 收益 率 序列 的 这 种 不 独立 性 . 

(a) 对 数 收益 率 P (c) 绝对 值 化 的 对 数 收 益 率 


5 10 15 2 
(ea) 


(b) 平方 了 的 对 数 收益 率 (d) 平方 了 的 对 数 收 益 率 


ACF 


0.0 
—0.2 
5 10 15 20 5 10 15 20 
间隔 间隔 
图 3-1 Intel 公司 股票 从 1973 年 1 月 到 2003 年 12 月 的 月 对 数 收 益 率 的 样本 自 相关 函数 和 
样本 偏 自 相 关 函 数 : (a) 对 数 收 益 率 的 样本 ACF; (b) 收益 率 平方 r? 的 ACF; (c) 对 
BT S 5 A608 (LH A |rt| 的 样本 ACR, (d) 收益 率 平 方 的 PACF 


为 了 把 波动 率 模型 放 在 一 个 合理 的 框架 中 , 考虑 给 定 t— 1 时 刻 已 知 的 信息 集 
Fia 时 ri 的 条 件 均值 和 条 件 方差 


n = E (ri |Fi-1), oP = Var (rela) = E [e c m)? Ra] (3.2) 
是 有 益 的 . 特别 地 , 信息 集 及 ,包含 过 去 收益 率 的 一 切线 性 函数 . 第 2 章 中 的 实 
例 和 图 3-1 表明 : 股票 收益 率 序列 r 即使 有 序列 相关 性 的 话 也 很 弱 . 因此 (3.2) 式 


中 关于 m 的 等 式 应 是 较 简单 的 , 我 们 假定 re 服从 一 个 简单 的 时 间 序 列 模型 , 如 带 
解释 变量 的 平稳 ARMA(p,q) 模型 . 换 句 话说 , 对 于 r 我 们 接受 模型 


k p q 
Te = Ht + at, pt = Po + >P Bixit + d. Pitti — > Ojai, (3.3) 
i=1 =1 i=l 


其 中 可 kp 和 q 是 非 负 整数 , zit 是 解释 变量 
模型 (3.3) 给 出 了 第 2 章 中 线性 时 间 序 列 模型 在 金融 中 的 可 能 应 用 . ARMA 
模型 的 阶 (p,q) 可 能 取决 于 收益 率 序列 的 频率 . 例如 , 股票 市 场 指数 的 日 收益 率 往 
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往 有 较 小 的 序列 相关 性 , 但 指数 月 收益 率 可 能 就 没有 任何 显著 的 序列 相关 性 . 模型 
(3.3) 中 的 解释 变量 zi 比较 灵活 , 例如 对 星期 一 这 天 设计 一 个 “ 陋 变 量 * (dummy 
variable) 来 研究 股票 日 收益 率 的 周末 效应 (the effect of weekend). 在 资本 资产 
定价 模型 (CAPM) 中 , re 的 均值 方程 可 以 写 为 7 = ho + Brine + ae, HP rine 代表 
市 场 组 合 的 收益 率 . 

结合 (3.2) 式 和 (3.3) 式 , 我 们 有 


02 = Var (rt |Fi-1 ) = Var (at |F1) (3.4) 


本 章 的 条 件 异 方差 模型 就 是 用 来 描述 o2 的 演变 的 . c? 随时 间 变 化 的 方式 可 以 用 
不 同 的 波动 率 模型 来 表示 . 

条 件 异 方差 模型 可 分 为 两 类 : 第 一 类 是 用 确定 的 函数 来 刻画 o2 的 演变 ; 第 二 
类 是 用 随机 方程 来 描述 o2. GARCH 模型 属于 第 一 类 , 而 随机 波动 率 模型 属于 第 
— S 

本 书 把 a, 称 为 资产 收益 率 在 t 时 刻 的 “扰动 ” 或 “新 息 ", o 为 of 的 正平 方 
根 . (3.3) 式 中 jp 的 模型 称 为 re 的 均值 方程 , o2 的 模型 称 为 r 的 波动 率 方程 . 因 
此 , 条 件 异 方差 性 建 模 就 是 对 时 间 序 列 模型 增加 个 动态 方程 , 来 刻画 资产 收益 率 
的 条 件 方差 随时 间 的 演变 规律 . 


3.3 建 模 


对 资产 收益 率 序列 建立 一 个 波动 率 模型 需要 如 下 4 个 步 又 . 

(1) 通过 检验 数据 的 序列 相关 性 建立 一 个 均值 方程 , 如 有 必要 , 对 收益 率 序列 
建立 一 个 计量 经 济 模型 (如 ARMA 模型 ) 来 消除 任何 的 线性 依赖 . 

(2) 对 均值 方程 的 残 差 进行 ARCH 效应 检验 . 

(3) 如 果 ARCH 效应 在 统计 上 是 显著 的 , 则 指定 一 个 波动 率 模型 , 并 对 均值 方 
程 和 波动 率 方程 进行 联合 估计 . 

(4) 仔细 地 检验 所 拟 合 的 模型 , 如 有 必要 则 对 其 进行 改进 . 

对 大 部 分 资产 收益 率 序列 , 如 果 有 序列 相关 性 的 话 , 也 很 弱 . 因此 , 如 果 样 本 均 
值 显著 的 不 为 零 的 话 , 建立 均值 方程 就 等 于 从 数据 中 移 除 样本 均值 . 对 于 某 些 日 收 
MEF, 建立 一 个 简单 的 AR 模型 是 必要 的 . 在 某 些 情形 下 , 均值 方程 可 能 要 用 
到 解释 变量 , 比如 为 解释 周末 效应 或 一 月 效应 而 引进 的 指示 变量 . 

在 下 文中 , 实证 分 析 用 的 软件 是 S-Plus. 其 他 的 一 些 的 软件 包 也 可 能 用 到 , 例 
如 Eviews, SCA, R 以 及 RATS 等 . 

ARCH 效应 的 检验 

为 了 符号 上 的 方便 , id a, = r- p 为 均值 方程 的 残 差 , 则 可 以 用 平方 序列 a? 
来 检验 条 件 异 方差 性 , 即 所 谓 的 ARCH 效应 . 有 两 个 检验 可 以 用 . 第 一 个 检验 是 将 
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通常 的 Lijung-Box 统计 量 {Q(m)} 应 用 于 序列 {a?}, 参见 Mcleod 和 Li (1983). 该 
检验 的 原 假设 是 (a2) 序列 前 mn 个 间隔 的 ACF 值 都 为 零 . 第 二 个 对 条 件 异 方差 的 
检验 是 Engle (1982) 的 拉 格 朗 日 乘 子 检验 . 该 检验 等 价 于 在 如 下 线性 回归 中 用 F 
统计 量 检验 o; = 0(i — 1, vm): 


a? = 19 4-0382 4 4 ecd tyi as +e, t=m+1,---,T, 
其 中 oe, 表示 误差 项 , m 是 事先 指定 的 正 整数 ， T 是 样本 容量 . 具体 地 ， 原 假 设 是 
Ho : 04 = --- = Am = 0. & SSRo = A (at - uy, Xo o = (1/7) > a? E a? 


t=m+ 


的 样本 均值 , IFA SSR; = E &2, 其 中 e, 是 前 面 线性 回归 最 小 二 乘 估计 的 残 差 . 
于 是 在 原 假 设 下 , 我 们 有 


(SSRo — SSR) /m 
SSR,/(T —2m—1)’ 


它 渐 近 服从 自由 度 为 m 的 x? 分 布 . 决策 规则 是 : 如 果 F > x2(o) 或 所 的 p 值 小 
于 a, 则 拒绝 原 假设 , 这 里 xz (a) 是 x2, 的 上 100(1 — a) 分 位 点 . 

为 通过 例子 说 明 上 述 理论 , 下 面 考虑 Intel 公司 股票 从 1973 年 到 2003 年 的 月 
对 数 收益 率 , 参见 下 面 的 例 3.1. 序列 没有 显著 的 序列 相关 性 , 因此 可 以 直接 来 检验 
ARCH 效应 . 事实 上 , 序列 的 Q(m) 统计 量 给 出 Q(12) = 18.57, p 值 为 0.10, 进 一 
步 确认 了 数据 没有 序列 相关 性 . 另 一 方面 , 拉 格 朗 日 乘 子 检 验 给 出 检验 统计 量 值 为 
F x 43.5, p 值 靠近 零 , 这 表明 有 很 强 的 ARCH 效应 . 

S-Plus 演示 
将 收益 举 序 列 记 为 inatc., 注意 到 命令 archTest 直 接应 用 于 序列 at, 而 不 是 a2. 
> autocorTest (intc, lag=12) 


Test for Autocorrelation: Ljung-Box 
Null Hypothesis: no autocorrelation 


F= 


Test Statistics: 
Test Stat 18.5664 p.value 0.0995 


Dist. under Null: chi-square with 12 degrees of freedom 
Total Observ.: 372 


> archTest(intc, lag=12) 
Test for ARCH Effects: LM Test 
Null Hypothesis: no ARCH effects 


Test Statistics: 
Test Stat 43.5041 p.value 0.0000 


Dist. under Null: chi-square with 12 degrees of freedom 
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3.4 ARCH 模型 


给 波动 率 建 模 提 供 一 个 系统 框架 的 第 一 个 模型 是 Engle(1982) 提出 的 ARCH 
模型 . ARCH 模型 的 基本 思想 是 : (a) 资产 收益 率 的 扰动 是 序列 不 相关 的 , 但 不 
是 独立 的 ; (b) a, 的 不 独立 性 可 以 用 其 延迟 值 的 简单 二 次 函数 来 描述 . 具体 地 说 , 一 
个 ARCH(m) 模型 是 假定 


2 2 2 
at = O18, O; = Qo - O10 i 二 十 Qmat_m (3.5) 


其 中 {e} 是 均值 为 0. 方差 为 1 的 独立 同 分 布 (iid) 随机 变量 序列 , ao > 0, 对 i>0 
有 o, >0. 系数 ai 必须 满足 一 些 正 则 性 条 件 以 保证 a, 的 无 条 件 方差 是 有 限 的 . SE 
际 中 , 通常 假定 c, 服从 标准 正 态 分 布 , 标准 化 的 学 生 上 分 布 , 或 广义 误差 分 布 . 

从 模型 的 结构 上 看 , 大 的 过 去 的 平方 “扰动 ”{a?_;} ”| 会 导致 新 息 at 的 大 的 
条 件 方差 02. 从 而 , a, 有 取 绝 对 值 较 大 的 值 的 倾向 . 这 意味 着 , 在 ARCH 的 框架 下 ， 
大 的 “扰动 ”会 倾向 于 紧 接着 出 现 另 一 个 大 的 “扰动 ". 这 里 用 “倾向 ”这 个 词 , 是 
因为 大 的 方差 不 一 定 意味 着 大 的 实现 值 , 它 只 表明 是 大 方差 发 生 的 概率 比 小 方差 情 
形 要 大 . 这 与 在 资产 收益 率 中 所 观察 到 的 “波动 率 聚 集 "(Volatility clustering) 现象 
相似 . 

ARCH 效应 也 出 现在 其 他 金融 时 间 序 列 中 . 图 3-2a 显示 了 1989 年 6 月 5 
日 至 1989 年 6 月 19 日 每 10 分 钟 间隔 观察 的 德国 马克 对 美元 的 汇率 的 百分比 
变化 量 的 时 间 图 3-2b 显示 的 是 这 个 百分比 变化 量 的 平方 所 构成 的 序列 的 时 间 图 . 
变化 量 的 大 的 百分比 时 有 发 生 , 但 存在 某 种 稳定 的 周期 . 图 3-3a 显示 的 是 这 个 百 
分 比 变 化 量 序 列 的 样本 自 相 关 函 数 , 它 清楚 地 表明 该 序列 没有 序列 相关 性 . 图 3-3b 


(a) 汇率 中 的 百分比 变化 


0 500 1000 1500 2000 2500 


(b) 平方 的 序列 
D4 
y 08 
pi n2 
* A 
UU 

0 500 1000 1500 2000 2500 
时 间 指 数 


图 3-2 (a) 1989 年 6 月 5 日 至 1989 年 6 月 19 日 每 10 分 钟 间 隔 的 
德国 马克 对 美元 汇率 的 收益 率 ; (b) 该 收益 率 的 平方 
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(a) 


0 10 20 30 
间隔 
3-3 (a) 德国 马克 对 美元 的 汇率 收益 率 序列 的 样本 自 相 关 函 数 ; 
(b) 平方 收益 率 序 列 的 样本 仿 自 相关 函数 


是 变化 量 的 百分比 序列 的 平方 所 构成 的 序列 的 样本 偏 自 相关 函数 , 可 见 这 个 函数 有 
一 些 大 的 值 , 这 表明 该 序列 不 是 独立 的 , 并 且 有 所 谓 的 ARCH 效应 . 

注释 有 些 作 者 把 (35) 式 中 的 条 件 方差 表示 为 ho eet “HH” ER a, = 
hie. L1 
3.4.1 ARCH 模型 的 性 质 

为 了 理解 ARCH 模型 的 含义 , 我 们 来 仔细 研究 一 下 ARCH(1) 模型 : 

(4 = Ove. 0? = ag + 0102. ,, 
其 中 ao > 0,0; 2 0. 首先 , a, 的 无 条 件 均值 仍 是 0, 因为 
E (a4) = E [E (a; | F1 )] = E [rE (e¢)] = 0. 

其 次 , a, 的 无 条 件 方差 是 

Var (at) = E (a?) = E [E (a? Fia )] =E [ou 十 o1a2 i] = ap 十 Ge 也 (uz. 4) s 
因为 a, EFH. E (a4) = 0, 所 以 Var (a) = 2 ed 1) = E(a?_,). 从 而 , 我 
们 有 Var (a4) = a + o4 Var (a+), Bl Var (a,) = E TT 因为 a, 的 方差 必须 为 正 的 ， 


我 们 需要 条 件 0 < o, < 1. 最 后 , 在 一 些 应 用 中 , 我 们 需要 a 更 高 阶 的 矩 存在 , 从 
而 o, 还 需 满足 另外 的 约束 条 件 . 例如 , 为 研究 oí 的 尾部 性 质 , 我 们 要 求 w 的 四 阶 
EARI. 在 (3.5) 式 中 假定 e. 服从 正 态 分 布 , 则 有 


E (a? |Fi-1) —3 [E (a? |Fi-1 y = 3 (ao + arag)? ? 


因此 
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E (a?) = E [E (a? |Fi-1)] = 3E (ao + aya?_,)* = 3E [o8 + 2aoe1a2. 1 + a2a$_,). 


7i a, 是 四 阶 平稳 的 且 记 ma = E (a2), 则 我 们 有 


ma = 3 [o$ + 200, Var (at) 十 aima] = 3o8 (1 十 2 A ) -3oim,. 
— cri 


从 而 
30g (14-01) 
(1 — 01) (1 —3oi) 
这 个 结果 有 ATER SX: (a) 因为 a, 的 四 阶 算是 正 的 , 所 以 ay 必须 满足 1-30? > 
0, BI 0 «a? <5 =; (b) a, 的 无 条 件 峰 度 是 


ms = 


E (a?) ag (1--04) (1— 0) 


[Var (a,)]* EE ay) (1 — 3a?) E ag |» 1-3o$' 

这 样 , a, 的 超额 峰 度 是 正 的 , 并 且 a 的 分 布 的 尾部 比 正 态 分 布 的 尾部 要 厚 ， 换 句 

话说 , 服从 条 件 高 斯 的 ARCH(1) 模型 的 “扰动 "at 比 高 斯 白 噪声 序列 更 容易 产生 

“异常 值 ” (outliers), 这 与 实证 结果 相 一 致 . 实证 结果 也 表明 资产 收益 率 中 出 现 “ 异 
Té (E^ 的 时 候 要 比 独立 同 分 布 的 正 态 随机 变量 序列 出 现 “ 异 常 值 ”的 时 候 多 . 

这 些 性 质 对 一 般 的 ARCH 模型 仍 成 立 , 但 对 高 阶 ARCH 模型 公式 会 变 得 更 复 

杂 一 些 . (3.5) 式 中 条 件 a; > 0 能 放松 , 这 是 一 个 保证 条 件 方差 cz 对 所 有 的 上 HUE 

值 的 条 件 . 事实 上 , 使 条 件 方差 取 正 值 的 一 个 自然 方式 是 把 ARCH (m) 模型 改写 成 


= 2 
Qt —O4E£1, ‘Gt = Gor At .t—-1%Amt—1, (3.6) 


其 中 Ame 1 = (01a, r Atm)’, 2 J&— m x m 阶 的 非 负 定 矩阵 ，(3.5) 式 定义 
的 ARCH(m) 模型 要 求 0 是 对 角 阵 . 这 样 , Engle 的 模型 是 用 一 个 非常 节省 参数 的 
方式 来 逼近 一 个 二 次 函数 . 实现 (3.6) 式 的 一 个 简单 方法 是 给 a, 一 个 随机 系数 模 
型 , 具体 可 参见 后 面 章节 讨论 的 CHARMA 模型 和 RCA 模型 . 


3.4.2 ARCH 模型 的 缺点 


ARCH 模型 有 不 少 优点 , 包括 前 一 节 中 讨论 的 性 质 . 该 模型 也 有 一 些 缺 点 . 

(1) ARCH 模型 假定 正 的 “扰动 * 和 负 的 “扰动 * 对 波动 率 有 相同 的 影响 , 因为 
波动 率 依赖 于 过 去 “扰动 ”的 平方 . 实际 中 , 众所周知 , 金融 资产 的 价格 对 正 的 和 负 
的 “扰动 ”的 反应 是 不 同 的 . 

(2) ARCH 模型 对 参数 的 限制 相当 强 . 比如 , 车 序列 有 有 限 的 四 阶 矩 , 则 ARCH(1) 
中 的 o 必须 在 区 间 [0, 1] 中 . 对 高 阶 的 ARCH 模型 , 这 种 约束 会 变 得 更 复杂 . 在 
实际 中 , 这 就 限制 了 带 高 斯 新 息 的 ARCH 模型 更 好 地 刻画 超额 峰 度 . 
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(3) 对 于 弄 清 一 个 金融 时 间 序 列 的 变化 的 来 源 , ARCH 模型 不 能 提供 任何 新 见 
fet. 它 只 是 提供 一 个 机 械 的 方式 来 描述 条 件 方差 的 行为 , 而 对 由 什么 引起 这 种 行为 
却 没 有 给 出 任何 启示 . 

(4) ARCH 模型 给 出 的 波动 率 预 报 值 会 偏 高 , 因为 它 对 收益 率 序 列 大 的 孤立 的 
“扰动 ”反应 缓慢 . 

3.4.3 ARCH 模型 的 建立 


在 所 有 的 波动 率 模型 中 , 建立 一 个 ARCH 模型 相对 来 说 是 比较 简单 的 . 下 面 
给 出 其 建 模 的 细节 . 


阶 的 确定 


如 果 通 过 检验 发 现存 在 显著 的 ARCH 效应 , 则 可 以 用 a2 的 偏 自 相 关 函 数 
(PACF) 来 确定 ARCH 模型 的 阶 . 下 面 我 们 来 说 明 用 a? 的 PACF 来 选择 ARCH 
模型 的 阶 是 合理 的 . 从 (3.5) 式 定 义 的 模型 出 发 , 我 们 有 


2 2 2 
9, = Ap TOT 4, Ft Og, gi 


对 给 定 的 样本 , a? 是 o? 的 无 偏 估计 . 因此 , 我 们 期 望 a? 以 m 阶 自 回 归 模 型 的 方 
AH af_1,… ,0?_m 线性 相关 . 注意 到 单个 的 a? 往往 不 是 o2. 的 有 效 估 计 , 但 它 可 
以 作为 一 个 近似 . 人 在 具体 确定 阶 m 时 这 个 近似 将 会 提供 充分 的 信息 . 

Fi FAIL, 定义 m = a; — oF. 那么 可 以 证 明 {m} 是 均值 为 零 的 不 相关 序列 . 
于 是 ARCH 模型 变 成 


2 2 
a? — ap + aragi *'* 中 Gm an T Mt: 


这 是 a? 的 AR(m) 形式 , 但 (n) 不 是 独立 同 分 布 的 序列 .由 第 2 章 的 内 容 , az 的 

PACF 是 确定 阶 m 的 有 用 工具 . 因为 {ne} 不 是 同 分 布 的 , 所 以 上 述 模型 的 最 小 二 

乘 估计 是 相合 的 , 但 不 是 有 效 的 . 当 样 木 容量 较 小 时 ，a? 的 PACE 可 能 不 是 有 效 的 . 
估计 


在 ARCH 模型 的 估计 中 通常 用 到 的 似 然 函数 有 三 个 ， 在 正 态 性 的 假定 下 , 
ARCH(m) 模型 的 似 然 函 数 为 


fa arla) = f (ar |Fr-1) f (ar—-1 |Fr—2)-+- f (@m+1 |Fm) f (21,777 ;am |o) 
T a2 


= I 1 exp [ii] x f (ai, , am lex), 
t—m-4 V 2na, any 


其 中 a= (ag, @i Ons) « f (ais yam |a) 是 G1,°** , Am 的 联合 概率 密度 函数 . 
因为 f(a1,… ,am Joc) 的 精确 形式 是 复杂 的 , 故 通常 把 它 从 上 述 似 然 函数 中 去 掉 ， 
特别 是 当 样 本 容量 很 大 时 . 这 就 导出 了 条 件 似 然 函数 
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2 
a, 


“3 1 
AI, vem [ae 
其 中 o? 可 以 递 推 地 计算 . BUTE ida EX Bl IR f AC TELE FO E 
件 最 大 似 然 估 计 (MLE). 
最 大 化 条 件 似 然 函 数 等 价 于 最 大 化 它 的 对 数 , 而 后 者 比 前 者 容易 处 理 一 些 . 条 
件 对 数 似 然 函 数 是 


f (m+ Gr |, a, Ain) = 


T 
1 1 1 a? 

U(Qm+1.**+ sar |a, ar, = ,am) = > |-z:n @x) - 5 In (e?) -35|. 
t 


t—m41 


因为 第 一 项 1n (2r) 不 包含 任何 参数 , 对 数 似 然 函数 变 成 


T 
1 la? 
l hr) 二 一 1 = In (a? * 35]. 
(Qin+1 T | 1 m) E- E (o7) 20? 


其 中 a? = ag + ma? 1 十 … 十 ama2_,, 可 递 推 地 计算 . 

在 有 些 应 用 中 , 假设 e, 服从 像 标 准 化 的 学 生 -t 分 布 这 样 的 厚 尾 分 布 更 合适 
一 些 . 设 随机 变量 re 服从 自由 度 为 v 的 学 生 t 分布 . DU] v > 2 时 有 Var (ay) = 
v/ (v — 2), 我 们 记 c = zy/ Vv/ (v — 2). e, 的 概率 密度 函数 为 


T ((u 4 1) /2) a —(v4-1)/2 

f (sv) == a n N (vf fe (1 io | , v2, (3.7) 

其 中 p) 38 2E NF iR ( BI T (z) = [ jenny. 利用 a, = over, 我们 
( 

得 到 o, 的 条 件 似 然 函数 


F: ^ L((va1)/2 1 a? 4 (v11)/2 
f (am+1 ;ar la, Am ) = aL, T (v/2) Jo — 3a To Dinos 十 at 


Hh v > 2, Am = (a1,--- ,am). 我 们 把 由 最 大 化 上 式 得 到 的 估计 称 为 学 生 -t 分 布 
假定 下 的 条 件 MLE. 学 生 七 分 布 的 自由 度 可 以 事先 给 定 , 也 可 以 和 其 他 参数 起 
估计 出 来 , 如 果 事 先 给 定 , 它 往往 是 3 到 6 之 间 的 一 个 值 . 

如 果 学 生 -t 分 布 的 自由 度 事先 给 定 , 那么 条 件 对 数 似 然 函 数 为 


-| a2 1 
l (am+i eere: AS |æ, Am ) EERS: P» EE In @ | (v = ia) + 2 In (e?) . (3.8) 
如 果 想 把 v 和 其 他 参数 一 起 估计 出 来 , 那么 包含 自由 度 的 对 数 似 然 函数 为 

l (&41,*** , a7 |o v, Am) = (T — m) [In (T ((v + 1) /2)) 

— In (T (v/2)) — 0.51n ((» — 2) x)] + l (am+1;, yar lec Am), 
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其 中 第 二 项 由 (3.8) 式 给 出 . 
最 后 可 以 假定 e, 服从 广义 误差 分 布 (GED), 其 密度 函数 是 


1 v 
_ vexp(—5|z/A|") 
f) = Xya-Vyor(ü/v)' 


Kp r (o) 是 通常 的 伽 玛 函数 , 且 


d= [2C ?/?T (1/v)/T(3/v)]'/?. 


—oo«zrz«oo, 0<v<¢oo. (3.9) 


如 果 v= 2, 则 GED 分 布 退化 为 高 斯 分 布 ; 如 果 w < 2, 则 CED 分 布 具 有 厚 的 尾 
部 . 可 以 很 容易 得 到 条 件 对 数 似 然 函 数 !(amn + …… ,ar |a, Am). 

模型 的 验证 

对 一 个 正确 指定 的 ARCH 模型 , 标准 化 的 残 差 


(4 
ay = — 
Or 


是 一 列 独立 同 分 布 的 随机 变量 序列 .因此 , 我 们 可 通过 检查 序列 (a,) 来 检验 所 拟 
合 的 ARCH 模型 的 充分 性 . 特别 地 , a, 的 Ljung-Box 统计 量 可 用 来 检验 均值 方程 
的 充分 性 , a? 的 Ljung-Box 统计 量 可 用 来 检验 波动 率 方程 的 正确 性 . {ar} 的 偏 度 、 
峰 度 、 分 位 点 对 分 位 点 图 (QQ FA) 可 用 米 检验 分 布 假定 的 正确 性 . S-Plus 中 提供 
了 许多 用 来 检验 模型 充分 性 的 残 差 网， 


预测 
由 (3.5) 式 定义 的 ARCH 模型 的 预测 可 类 似 于 AR 模型 一 样 递 推 地 得 到 . 考 
虑 一 个 ARCH(m) 模型 . 从 预测 原点 h 出发, o2, , 的 向 前 一 步 预测 为 
oF (1) = ag + 018; + + Gmaz41-m: 
问 前 纳 步 预测 为 
of (2) = ag + 0107 (1) + aga? + ---+ amakyo mn， 


oF.) 的 向 前 1 步 预测 为 


a (1) = a0 + > aio} (1 — i), (3.10) 


i=] 
Hh, 3$ -igo Jl o? (1 —i) =a 
3.4.4 ”一些 例子 
本 节 通 过 两 个 例子 来 说 明 ARCH 模型 的 建 模 . 
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例 3.1 我 们 首先 应 用 建 模 方法 来 给 Intel 公司 股票 的 月 对 数 收益 率 建立 一 个 简单 
的 ARCH 模型 . 图 3-1 中 收益 率 平方 序列 的 ACF A PACF 清楚 地 表明 了 条 件 异 方 
差 性 的 存在 . 3.3 节 给 出 的 ARCH 效应 检验 进一步 证 实 了 条 件 异 方差 性 的 存在 . 接 
下 来 我 们 要 做 的 是 识别 ARCH 模型 的 阶 . 图 3-1d 中 的 样本 PACF 表明 ARCH(3) 
模型 可 能 是 合适 的 , 因此 下 面 将 对 Intel 股票 的 月 对 数 收益 率 具体 建立 一 个 如 下 形 
式 的 模型 : 


竹 三 有 二 Qt， =e, OÈ = ag + ala2 1 T Q202 » i O307 4. 
假定 e, 是 独立 同 分 布 的 标准 正 态 序列 , 我 们 得 到 的 拟 合 模型 为 
人 二 0.0171 十 at， of =0.012 0 + 0.178 7a?_, 十 0.077 2a? , + 0.057 2a?_,, 


各 个 参数 估计 值 的 标准 误差 分 别 是 0.006 6, 0.001 1, 0.080 3, 0.050 6 和 0.076 9, 参 
见 下 面 的 输出 结果 . 尽管 估计 值 满足 ARCH(3) 模型 的 一 般 条 件 , 然而 os 和 as 的 
估计 值 在 5 贸 的 水 平 下 不 是 统计 显著 的 , 因此 模型 可 以 简化 . 

S-Plus 演示 


下 面 是 输出 结果 , 这 里 % 表 示 注 释 . 


> arch3.fit-garch(intc-1,-garch(3,0)) 

> summary (arch3 .fit) 

Call: 

garch(formula.mean = intc ~ 1, formula.var = ~ garch(3, 0)) 


Mean Equation: intc ~ 1 
Conditional Variance Equation:  - garch(3, 0) 
Conditional Distribution: gaussian 


Value Std.Error t value Pr(»|t|) 


C 0.01713 0.006626 2.5860 0.005047 % one-sided 
A 0.01199 0.001107 10.8325 0.000000 % p-value 
ARCH(1) 0.17874 0.080294 2.2260 0.013309 
ARCH(2) 0.07720 0.050552 1.5271 0.063800 
ARCH(3) 0.05722 0.076928 0.7438 0.228747 


> archl=garch (inte~1,~garch(1,0)) & A simplified model 

> summary (archi) 

Call: 

garch(formula.mean - inte ~ 1, formula.var = - garch(1,0)) 


Mean Equation: inte ~ 1 
Conditional Variance Equation: ~ garch(1, 0) 
Conditional Distribution: gaussian 


Estimated Coefficients: 
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Value Std.Error t value Pr(>|t|) 

C 0.01741 0.006231 2.794 2.737e-03 

A 0.01258 0.001246 10.091 0.000e+00 
ARCH(1) 0.35258 0.088515 3.983 4.094e-05 


> stdresi=archl$residuals/archl$sigma.t % Standardized 
> autocorTest (stdresi, lag=10) % residuals 
Null Hypothesis: no autocorrelation 

Test Statistics: 

Test Stat 13.7820 p.value 0.1832 


Dist. under Null: chi-square with 10 degrees of freedom 
> archTest (stdresi,lag=10) % ARCH test for residuals 


Null Hypothesis: no ARCH effects 
Test Statistics: 
Test Stat 11.3793 p.value 0.3287 


Dist. under Null: chi-square with 10 degrees of freedom 
> archi$asymp.sd % Obtain unconditional variance 
[1] 0.1393796 


> plot(archl1) % Obtain various plots, including the 
& fitted volatility series. 


去 掉 两 个 不 显著 的 参数 , 我 们 得 到 的 模型 为 
re=0.0174+aq, of = 0.012 6 + 0.352 6a2 , (3.11) 


其 中 各 参数 估计 的 标准 误差 分 别 为 0.006 2, 0.001 2 和 0.088 5, 且 所 有 估计 都 是 高 
度 显 车 的 . 图 3-4 显示 的 是 标准 化 的 残 差 {a} 的 时 间 图 和 标准 化 残 差 (a,) 的 某 些 
函数 的 样本 ACF. 标准 化 残 差 {a,} 的 Ljung-Box 统计 量 为 (10) = 13.78, p 值 为 
0.18. {a7} 的 Ljung-Box 统计 量 为 8 (10) = 11.38, p 值 为 0.33, 参见 输出 结果 . 
此 , 在 5% 的 显著 性 水 平 下 , (3.11) 式 的 ARCH(1) 模型 能 充分 地 描述 给 定数 据 的 条 
件 异 方差 性 . 

(3.11) Xf ARCH(1) 有 一 些 有 趣 的 性 质 : 首先 , Intel 公司 股票 的 月 对 数 收 益 
率 的 期 望 值 大 约 1.74%, 这 是 值得 注意 的 , 特别 是 样本 包含 了 Intel 公司 泡沫 后 的 
时 期 ; 其 次 , 63 = 0.353? < 1/3, 从 而 Intel 公司 股票 月 对 数 收益 率 的 无 条 件 四 阶 矩 
是 有 限 的 ; 再 次 , re 的 无 条 件 标准 差 是 V0.012 6/ (1 — 0.352) = 0.139 4; 最 后 , 该 
ARCH(1) 模型 可 以 用 来 预测 Intel 股票 收益 率 的 月 波动 率 . 

学 生 -t 分 布 的 新 息 

为 了 比较 , 在 新 息 服从 学 生 - 分布 的 假定 下 给 该 序列 拟 合 一 个 ARCH(1) 模 
型 : 

re 一 0.0221 十 at， 07 = 0.013 4 十 0.249 2a? ,, (3.12) 
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(n) 


{ 1975 1980 1985 1990 1995 2000 2005 
间隔 间隔 
图 3-4 ”对 Intel 公司 股票 从 1973 年 1 月 至 2003 年 12 月 的 月 对 数 收益 率 建立 高 斯 ARCH(1) 


模型 (3.11) 式 后 , 各 种 模型 检验 统计 量 的 值 : (a), (b), (c) 分 别 是 标准 化 残 差 本 身 、 它 
们 的 平方 以 及 绝对 值 序列 的 样本 ACF, (d) 是 标准 化 残 差 的 时 间 图 


其 中 各 参数 估计 的 标准 误差 分 别 为 0.006 0, 0.002 0 和 0.115 6. 学 生 -t 分 布 自由 度 
的 估计 值 是 6.16, 标准 差 是 1.65. 所 有 估计 值 在 5% 的 水 平 下 是 显著 的 , 但 & 的 上 统 
计量 仅 为 2.16. a, 的 无 条 件 标准 差 是 V0.013 47 (1 — 0.249 2) = 0.133 6, 这 与 正 态 性 
假定 下 得 到 的 上 统计 量 的 值 相近 . 标准 化 残 差 的 Ljung-Box 统计 量 为 Q (12) = 16.1, 
p 值 为 0.19, 证 实 均值 方程 是 充分 的 . 但 是 , 标准 化 残 差 平 方 的 Ljung-Box 统计 量 
的 值 为 8 (12) = 29.91, p 值 为 0.002 9, 波动 率 方程 在 5% 的 水 平 下 是 不 充分 的 . HE 
一 步 的 分 析 表 明 , 拉 格 朗 日 乘 子 检验 统计 量 的 值 为 Q(10) = 13.07, p 值 为 0.22. 波 
动 率 方程 的 不 充分 性 是 由 于 标准 化 平方 残 差 中 存在 更 高 阶 的 相关 性 . 

比较 模型 (3.11) 式 和 (3.12) 式 , 我 们 可 以 看 到 以 下 几 点 : (a) 使 用 具有 厚 尾 分 
布 的 e, 可 以 降低 ARCH 效应 ; (b) 对 这 个 特殊 例子 来 说 ， 这 两 个 模型 差别 不 大 . 最 
后 , 对 这 组 数据 更 适合 的 模型 是 GARCH(1,1) 模型 , 对 此 将 在 下 一 节 给 出 讨论 . 


S-Plus 演示 
Wt 分 布 的 新 息 . 


> archlt-garchn(intc-1,-garchí(í(1,0),cond.dist-'t') 

> summary (archit) 

Call: 

garch(formula.mean = intc ~ 1, formula.var = ~ garch(1, 0), 
cond.dist = "t') 
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Mean Equation: intc ~ 1 
Conditional Variance Equation: ~ garch(1, 0) 
Conditional Distribution: t 
with estimated parameter 6.159751 and standard error 1.647094 
Estimated Coefficients: 
Value Std.Error t value Pr(>|t|) 

C 0.02213 0.006010 3.681 1.333e-04 

A 0.01338 0.001965 6.809 2.001e-11 
ARCH(1) 0.24916 0.115574 2.156 1.587e-02 


AIC(4) = -477.9073, BIC(4) = -462.2317 


Ljung-Box test for standardized residuals: 


> dd LLLI T I wee ee ee ee ee E eee ee ee ee 


Statistic P-value Chi*2-d.f. 
16.1 0.1868 12 


Ljung-Box test for squared standardized residuals: 


Statistic  P-value Chi^2-d.f. 


29.91 0.002882 12 
注释 ”在 S-Plus 中 , #4 GARCH 允许 几 种 条 件 分 布 . 具体 来 讲 是 , cond.dist= 
C't?? 或 ‘‘ged?!, 缺 省 时 为 高 斯 分 布 . 口 


例 3.2 ”考虑 马克 对 美元 十 分 钟 时 间 间 隔 汇 率 的 百分比 变化 量 . 图 3-2a 已 经 给 出 
了 该 数据 的 时 间 图 .如 图 3-3a 显示 的 , 此 序列 没有 序列 相关 性 , 但 其 平方 序列 的 
样本 PACE 有 些 大 的 值 , 特别 是 间隔 为 1 和 3 时 ， 在 某 些 较 大 的 间隔 时 , PACF 
有 较 大 的 值 , 但 较 小 的 间隔 更 重要 一 些 ， 按照 前 一 小 节 讨 论 的 方法 , 我 们 将 对 该 
序列 拟 合 一 个 ARCH(3) 模型 ， 利 用 条 件 高 斯 似 然 函数 , 我 们 得 到 拟 合 的 模型 是 
rı = 0.001 8 + oye, 和 


of = 0.22 x 107? + 0.322a?_, + 0.074u?_, + 0.093a2_,, 


其 中 波动 率 方程 中 所 有 的 估计 在 5 的 水 平 下 都 是 统计 显著 的 ， 标 准 误差 分 别 是 
0.47 x 107, 0.017, 0.016 和 0.014, 用 标准 化 的 残 差 a, 进行 的 模型 检验 , 表明 了 该 
模型 是 充分 的 . 
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虽然 ARCH 模型 简单 , 但 为 了 充分 地 描述 资产 收益 率 的 波动 率 过 程 , 往往 需 
要 很 多 参数 . 例如 , 考虑 下 面 例 3.3 中 的 S&P500 指数 的 月 超额 收益 率 , 其 波动 率 
Weta ARCH(9) 模型 来 刻画 . 这 样 就 必须 寻找 其 他 模型 ,Bollerslev(1986) 提出 
了 一 个 有 用 的 推广 形式 , 称 为 广义 的 ARCH 模型 (GARCH). 对 于 对 数 收益 率 序 
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列 re È a, = ri — ju At 时 刻 的 新 息 . 称 a, 服从 GARCH(m, s) 模型 , 车 a, 满足 
FA: " à 
a= 0,65 0; — Qo - 9 aiat) bolj (3.13) 
i=1 iz 


其 中 {ei} 是 均值 为 0、 方差 为 1 的 独立 同 分 布 随机 变量 序列 , oo > 0, a; > 0, 8; > 0, 


maxím,s) 


> (a, +8) < 1 (GBR i > m, ai = 0, X} j > s, 8; — 0). XE ai + 8; 的 限 
制 条 件 保证 a 的 无 条 件 方差 是 有 限 的 , 同时 它 的 条 件 方差 o 是 随时 间 变 化 的 . 如 
前 面 一 样 , 通常 假定 c, 是 标准 正 态 的 或 标准 化 的 学 生 -t 分 布 或 广义 误差 分 布 . 若 
s = 0, (3.13) 式 就 简化 成 一 个 ARCH(m) 模型 .a; 和 B; 分 别称 为 ARCH 参数 和 
GARCH 参数 . 

为 了 弄 清 GARCH 模型 的 性 质 , 采用 如 下 表示 是 有 用 的 .  m = a? — o2, 也 
BH o? = a? m 把 ofi = a; ;一 Wi(i = 0,… ,8) HA (3.13) 式 , 我们 就 能 把 
GARCH 模型 改写 成 如 下 形式 


max(rn,s) 
a2 = ug 十 > (o, + fi) a2. .; +m — 3^5; ‘The. 3- (3.14) 
i=l j=1 
容易 验证 {m} 是 ARETY (BI Er = 0 AXt j z 1 A cov(m,m—j) = 0). fH {m} 
一 般 不 是 独立 同 分 布 序列 . (3.14) 式 对 序列 a2 来 说 是 ARMA 形式 , 因此 GARCH 
模型 可 认为 是 ARMA 的 思想 对 平方 序列 a2 的 应 用 . 利用 ARMA 模型 的 无 条 件 均 
值 , 我 们 有 


TO 
只 要 上 式 的 分 母 是 正 的 . 

GARCH 模型 的 优点 和 缺点 , 可 以 通过 对 最 简单 的 GARCH(1,1) 模型 的 分 析 看 
H. GARCH(1.1) 模型 为 


o; = a 十 wa 4 十 Bio? 3. 0x«oy Mib m+ < l1. (3.15) 


第 一 , 大 的 az , HE o2 , 引起 大 的 o2, 这 意味 着 大 的 a, SRA a2, 
这 样 就 会 产生 在 金融 时 间 序 列 中 有 名 的 “波动 率 聚 集 ” 现 象 . 第 二 , 可 以 证 明 ， 5 
1— 2a? — (o1 十 8? > 0, Dii 


Bat) | 3[1~ (+ AY] 
[E (a2)? 1 —(a, +A)? — 202 


从 而 , 与 ARCH 模型 类 似 , GARCH(1,1) 过 程 分 布 的 尾部 比 正 态 分 布 尾部 厚 . 第 三 ， 
此 模型 给 出 了 一 个 简单 的 参数 函数 来 描述 波动 率 的 演变 ， 
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GARCH 模型 的 预测 可 用 类 似 于 ARMA 模型 的 方法 得 到 ， 考 虑 (3.15) 式 的 
GARCH(1,1) 模型 , 假定 h 为 预测 原点 . 对 向 前 一 步 预测 , 我 们 有 


05,1 = 09 + aiak + B07, 
其 中 us 和 o; 在 时 间 指 标 为 h 处 是 已 知 的 . 因此 , 向 前 一 步 预 测 为 
a7 (1) = ag + ara? + fio. 
对 向 前 多 步 预测 , 我 们 用 a? = cze2, 并 把 (3.15) 式 的 波动 率 方程 改写 成 
at 一 ao 十 (aa + i) o? + 010; (ef — 1). 
SB t=h+ 1, 此 方程 变 为 
Thao = 09 + (o1 - 1) 02.41 - 0102.43 (6244 — 1). 
IK E (ef yi 一 1|F;) =0, 故 以 为 预测 原点 的 波动 率 的 向 前 2 步 预测 满足 
ok (2) = ao 十 (aa + 61) 0%, (1). 
一 般 地 , 我 们 有 
e; (I) =ao + (a, +f) 02 (L— 1), 1» 1. (3.16) 
这 个 结果 与 自 回归 多 项 式 为 1 一 (a + 61) B 的 ARMA(1,1) 模型 是 完全 相同 的 . 对 
(3.16) RRL, 我 们 得 到 向 前 | 步 预测 能 写成 


ap [ — (on -- Ary) 


2 = 
oh (l) = l-u = 


+ (oi + 8) 7 o? (1). 
从 而 , 只 要 ay 5, <1, 就 有 


A= a iot. 
因此 , 只 要 ay 的 无 条 件 方差 Var (ae) 存在 , 当 预 测 步 长 赵 于 无 穷 时 GARCH(1,1) 
模型 的 向 前 多 步 波动 率 预 测 是 收敛 于 Var (at) 的 . 

XT GARCH 模型 的 文献 非常 多 , 读者 可 参见 Bollerslev, Chou 和 Kroner(1992), 
Bollerslev, Engle 和 Nelson(1994)， 以 及 这 两 篇 文章 的 参考 文献 ，GARCH 模型 与 
ARCH 模型 有 相同 的 弱点 , 例如 , 它 对 正 的 和 负 的 “扰动 * 有 相同 的 反应 . 另外 , 新 
近 关 于 高 频 金 融 时 间 序 列 的 实证 研究 表明 GARCH 模型 的 尾部 太 薄 , 即使 新 息 是 服 
从 学 生 -t 分 布 的 GARCH 模型 , 也 不 足以 描述 实际 高 频数 据 的 尾部 . 关于 GARCH 
模型 峰 度 的 研究 , 参见 3.16 节 . 
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3.5.1 实例 说 明 


ARCH 模型 的 建 模 方法 也 可 以 用 来 建立 一 个 GARCH 模型 . 然而 , GARCH 模 
型 的 阶 不 太 容易 确定 . 在 实际 应 用 中 , 只 用 到 低 阶 的 GARCH 模型 , 如 GARCH(1,1) 
BUS. GARCH(2,1) 模型 、GARCH(1,2) 模型 等 . 假定 波动 率 (o2) 的 初始 值 是 已 知 
的 , 条 件 最 大 似 然 法 仍然 可 以 用 . 例如 , 考虑 GARCH(1,1) 模型 , HUA o? 是 固定 
的 , 则 GARCH(1,1) 模型 的 o? 可 以 递 推 得 到 . 在 一 些 应 用 中 , a, 的 样本 方差 作为 
c? 的 初始 值 较 好 . 可 以 用 标准 化 的 残 差 d, = a/o 和 它 的 平方 序列 来 检验 所 拟 合 
的 模型 的 充分 性 . 
例 3.3 ”在 这 个 例子 中 , 我 们 考虑 S&P500 指数 的 月 超额 收益 率 , 从 1926 年 开始 ， 
jk 792 个 观察 值 , 如 图 3-5 Pras. dd r 为 超额 收益 率 , 图 3-6 所 示 的 是 re 的 样本 
ACF 和 r? 的 样本 PACF. r, 序列 在 间隔 为 1 和 间隔 为 3 时 有 少许 序列 相关 性 , 但 
主要 特征 还 是 r? 的 PACF 最 示 强 烈 的 线性 相关 性 . BWA MA(3) 模型 , 则 得 到 


re = 0.006 2 + a; + 0.094 4a, , — 0.140 7at-3， 64 = 0.057 6, 


其 中 所 有 的 系数 在 5% 的 水 平 下 都 是 显著 的 . 然而 , 为 简单 起 见 , 我 们 使 用 AR(3) 
模型 
re = ditt—1  Q271—2 + O3rt—3 + Bo + at. 
在 正 态 性 的 假定 下 , 所 拟 合 的 AR(3) 模型 为 
Tr, = 0.088ry_1 — 0.0237t_2 — 0.123r, 3 十 0.006 6 十 ai， 562 一 0.003 33. (3.17) 
对 GARCH 效应 , 我 们 用 GARCH(1,1) 模型 


2 2 2 
Qt = Ort, Of = Q0 H B104. , + 0104. ,. 


0 200 400 600 800 


时 间 指 数 
图 3-5 S&P500 指数 月 超额 收益 率 的 时 间 序 列 图 
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0 5 10 16 20 25 30 
间隔 


图 3-6 (a) S&P500 指数 月 超额 收益 率 的 样本 ACF; (b) 月 超额 收益 率 平方 的 样本 PACF 


对 该 AR(3)-GARCH(1,1) 模型 进行 联合 估计 得 到 


re = 0.007 8 十 0.032rt_l 一 0.029rt_2 — 0.008r,..3 + az, 
of = 0.000 084 + 0.121 3a?_, + 0.852 302. 


由 波动 率 方程 , a. 的 隐 含 的 无 条 件 方差 为 
0.000 084 
1 — 0.852 3 — 0.121 3 
这 与 (3.17) 式 中 的 62 非常 接近 . 然而 , 均值 方程 中 的 各 参数 的 (— 比 表明 三 个 自 回 
归 系 数 在 5% 的 水 平 下 都 不 显著 . 因此 , 我 们 去 掉 所 有 自 回 归 系 数 来 改进 模型 , 改 
进 后 的 模型 为 


rie = 0.007 6 +a, o? = 0.000 086 + 0.121 Ga?_, 十 0.851 102 ,. (3.18) 


均值 方程 中 常数 项 的 标准 误差 为 0.001 5, 而 波动 率 方程 中 三 个 参数 的 标准 误差 分 别 
为 0.000 024, 0.019 7 和 0.019 0. a, 的 无 条 件 方差 为 0.000 086/ (1 — 0.851 1 — 0.121 6) 
= 0.003 14. 这 是 一 个 简单 的 平稳 GARCH(1,1) 模型 . 对 于 (3.18) 式 的 GARCH(1,1) 
模型 , 图 3-7 所 示 的 是 被 估 波 动 率 过 程 o, 和 标准 化 的 “扰动 "ma = at/o 的 时 间 图 . 
à, 序列 看 起 来 像 白 噪声 过 程 , 图 3-8 给 出 了 标准 化 残 差 a, Al a? 的 样本 ACF, 这 
两 个 ACF 不 能 表明 在 标准 化 残 差 过 程 中 有 显著 的 序列 相关 性 或 条 件 异 方差 性 . 更 
具体 地 说 , 对 a, RANA Q(12) = 11.99(0.45) 和 Q(24) = 28.52(0.24), 对 a2 有 
Q (12) = 13.11(0.36), Q (24) = 26.45(0.33), 括号 中 的 数 为 对 应 检验 统计 量 的 p 值 . 
因此 , 模型 似乎 能 充分 描述 收益 率 序列 和 波动 率 序列 的 线性 相依 关系 . 注意 到 所 拟 
合 的 模型 表明 à, + Âi = 0.977 2, 非常 接近 于 1. 这 种 现象 在 实际 中 是 常见 的 , 以 
至 于 经 常 在 GARCH(1,1) 模型 中 加 上 限制 o; -- 8; = 1, 从 而 引出 求 和 GARCH( 或 
IGARCH) 模型 , 见 3.6 节 . 


= 0.003 17, 
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(a) 


1940) 1960 1980 


1940 1960 1980 
年 


3-7 (a) 对 S&P500 指数 的 月 超额 收 益 估 计 出 的 波动 率 的 时 间 序 列 图 ; (b) S& P500 指数 的 月 
超额 收益 率 的 标准 化 “扰动 " 的 时 间 序 列 图 . 两 个 图 部 是 基于 (3.18) 式 的 GARCH(1,1) 
模型 


(a) 


5 10 15 20 
间隔 


图 38 对 S&P500 指数 的 月 超额 收益 率 所 建 的 GARCH(1,1) 模型 (3.18) 式 的 模型 检验 : 
(a) 标准 化 残 差 的 样本 ACF; (b) 标准 化 残 差 平方 的 样本 ACF 


最 后 , 为 了 预测 S&P500 指数 的 月 超额 收益 率 的 波动 内, 我 们 可 以 用 (3.18) 式 
中 的 波动 率 方程 . 例如 , 在 预测 原点 h, 有 oF, = 0.000 086 + 0.121 6a? 十 0.851 102. 
向 前 1 步 预 测 是 


oF (1) = 0.000 086 十 0.121 Ga? + 0.851 107, 


其 中 an 是 上 时 刻 均 值 方程 的 残 差 , o2 由 波动 率 方程 得 到 . 初始 值 o2 可 取 0 或 a 
的 无 条 件 方差 . 对 多 步 向 前 预测 , 我 们 可 以 利用 (3.16) 式 的 弟 推 公式 . 表 3-1 给 出 
了 基于 (318) 式 的 GARCH(1,1) 模型 、 以 h 为 预测 原点 对 S&P500 指数 月 超额 收 
益 率 的 均值 以 及 波动 率 预 测 的 结果 . 
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表 3-1 S&P500 指数 的 月 超额 收益 率 的 波动 率 预 测 ， 预测 原点 为 h = 792， 对 应 的 时 间 
点 为 1991 年 12 A. 此 处 , 波动 率 是 条 件 标 准 差 


0.007 6 0.007 6 0.007 6 0.007 6 0.007 6 
0.053 7 0.053 7 0.053 8 0.053 8 0.056 0 


0.007 6 
0.053 6 


例 3.3 中 用 到 的 一 些 S-Plus 命令 
> fit-garch(sp-ar(3),-garchí(1,1)) 
> summary (fit) 
> fit-garch(sp-1,-garch(1,1)) 
> 
> 


summary (fit) 

names (fit) 

[1] "residuals" "sigma.t" "df.residual" "coef" "model" 
[6] "cond.dist" "likelihood" "opt.index" "cov" 
[10] "prediction" "call" "asymp.sd" "series" 


> $ Next, compute the standardized residuals 
> stdresi-fit$residuals/fit$sigma.t 
» autocorTest (stdresi,lag-24) 

> autocorTest(stdresi^2,1ag-24) 

> predictí(fit,5) $ Compute predictions 


注意 到 在 上 述 命 令 中 波动 率 序列 存储 在 fit$sigma.t 中 , 收益 率 的 残 差 序列 
存储 在 fit$residuals 'h. 


学 生 -t 分 布 的 新 息 
假定 e, 服从 自由 度 为 5 的 标准 化 学 生 -t 分 布 , 我 们 重新 估计 GARCH(1,1) 模 
型 , 得 到 
re =0.0085+ ar, of=0.00012+0.112 1a?_, 十 0.843 20? ,, (3.19) 


其 中 参数 的 标准 差分 别 为 0.001 5, 0.51 x 10-4, 0.029 6 和 0.037 1, 这 个 模型 本 质 
上 是 一 个 IGARCH(1,1) 模型 , 因为 à, + A, = 0.95, 非常 靠近 1， 标 准 化 残 差 的 
Ljung-Box 统计 量 为 Q(10) = 11.38, p 值 为 0.33, 而 a? 的 Ljung-Box 统计 量 为 
Q (10) = 10.48, p 值 为 0.40. 这 样 所 拟 合 的 带 学 生 -t 分 布 新 息 的 GARCH(1,1) 模 
型 是 充分 的 . 

用 到 的 S-Plus 命令 


> fiti = garch(sp-1,-garch(1,1),cond.dist-'t',cond.par-5, 
+ cond.est-F) 

> summary (fit1) 

> stresi=fitl$residuals/fitl$sigma.t 

> autocorTest (stresi, lag=10) 

> autocorTest (stresi*2,lag=10) 


自由 度 的 估计 


如 果 我 们 更 进一步 地 拓展 上 述 GARCH(1,1) 模型 , 其 中 学 生 -t 分 布 的 自由 度 
不 是 给 定 的 而 是 通过 数据 估计 出 的 , 得 到 的 模型 为 
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re = 0.008 5+ a, 07 = 0.000 12 十 0.112 1a?_, 十 0.843 202}, (3.20) 


其 中 所 估 计 的 自由 度 为 7.02. (3.20) 式 中 参数 估计 值 的 标准 误差 与 (3.19) 式 的 非常 
接近 , 自由 度 估计 的 标准 误差 为 1.78， 从 而 , 在 5% 的 显著 性 水 平 下 我 们 不 能 拒绝 
使 用 自由 度 为 5 的 学 生 -t 分布， 

用 到 的 S-Plus 命令 


> fit2 = garch(sp~1,~garch(1,1),cond.dist=‘t’) 
> summary (fit2) 


3.5.2 ”预测 的 评估 

由 于 资产 的 波动 率 是 不 能 直接 观测 的 , 所 以 比较 不 同 波动 率 模型 的 预测 表现 对 
数据 分 析 师 来 说 是 一 个 挑战 . 文献 中 , 有 的 研究 人 员 利 用 样本 以 外 (out-of-sample) 
的 预测 , 比较 波动 率 的 预测 值 o2 (1) 与 预测 样本 中 的 “扰动 "a? ,， 来 评价 波动 模型 
的 预测 表现 中 用 这 个 方法 常常 会 发 现 al, 和 o (1) 有 较 低 的 相关 系数 , 即 低 的 R2. 
这 个 发 现 并 不 奇怪 , 因为 单独 的 02, 本身 不 能 充分 度量 htl 时 刻 波动 的 率 . 例如 ， 
对 向 前 一 步 预测 , 从 统计 观点 讲 , E (of |F.) = 只 因此 a2,, 是 o2,, 的 相合 
估计 . 但 它 不 是 o2,, 的 精确 估计 , 因为 一 个 有 已 知 均 值 的 随机 变量 的 单个 观测 值 
不 可 能 提供 该 随机 变量 方差 的 精确 估计 . 从 而 , 严格 地 说 , 这 种 评价 波动 率 模型 预 
测 表现 的 方法 是 不 正确 的 . 关于 GARCH 模型 预测 评价 的 更 多 信息 ,读者 可 参见 
Andersen 和 Bollerslev(1998). 


3.5.3 ”两 步 估 计 方 法 


基于 (3.14) 式 , 可 以 用 两 步 估 计 方 法 来 估计 GARCH BUS. 第 一 步 , 忽略 ARCH 
效应 , 用 第 2 章 讨论 的 方法 (例如 最 大 似 然 方法 ) 为 收益 率 序列 估计 一 个 均值 方程 . 
残 差 序列 用 a, 表示 . 第 二 步 , 将 (a2) 作为 观测 序列 , 可 以 用 最 大 似 然 方法 估计 
(3.14) 式 中 的 参数 . 用 o, Al Â 分 别 表 示 AR 系数 和 MA 系数 , 则 GARCH 模型 的 
参数 估计 为 记 0, à; = 9, — 6. 显然 , 这样 的 估计 只 是 真实 参数 的 一 种 近似 , 它 
们 的 统计 性 质 并 没有 得 到 严格 的 研究 . 然而 , 限定 在 一 定 范围 内 的 经 验 表明 , 这 个 
简单 的 方法 往往 能 够 提供 好 的 近似 , 尤其 是 当 样本 容量 适中 或 较 大 时 更 是 如 此 . 例 
如 , 考虑 例 3.3 中 S&P500 指数 的 月 超额 收益 率 . 用 SCA 中 的 条 件 似 然 方法 , 我 们 
可 以 得 到 下 述 模型 : 


re = 0.006 1+ at, a? = 0.000 14 + 0.958 3a?_, + m — 0.845 6m_1. 


其 中 , 所 有 的 估计 在 5%% 的 显著 性 水 平 下 都 显著 地 不 为 0. 从 这 些 估计 中 看 出 , 记 = 
U.845 6, &; = 0.958 3 — 0.845 6 = 0.112 7. 这 种 近似 估计 与 (3.18) 式 和 (3.20) 式 中 
的 估计 非常 靠近 . 进一步 地 , 用 岗 步 估计 方法 拟 合 的 波动 率 与 图 3-7a 也 非常 靠近 . 


(D 也 就 是 把 整个 样本 分 成 两 个 部 分 , 用 一 部 分 (往往 是 大 部 分 ) 来 预测 另 一 部 分 ( 称 为 预测 样本 ), 可 得 
anyi 和 of (1). 一 一 Wed 
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3.6 A GARCH 模型 


车 (3.14) 式 中 的 GARCH 表示 的 AR 多 项 式 有 一 个 单位 根 , 则 我 们 就 得 到 了 
IGARCH 模型 . 因此 , IGARCH 模型 就 是 单位 根 GARCH 模型 . 类 似 于 ARIMA 模 
型 , IGARCH 模型 的 主要 特点 是 过 去 的 平方 扰动 m; =a? — o? i> 098 a2 ff] 
影响 是 持久 的 . 

一 个 IGARCH(1,1) 模型 能 写成 


> CONS F, 2 - 2 
at= Ern Of — Og o 9190, 4 十 (1 = 5) Op. 


其 中 {a} 与 前 面 一 样 定义 , 1 > 0; > 0. 对 S&P500 指数 的 月 超额 收益 率 数据 估计 
出 的 IGARCH(1.1) 模型 为 


r, = 0.006 7 +04, 4 — O7€4, 
o? = 0.000 119 + 0.805 962. , + 0.194 1a?_,, 


其 中 波动 率 方程 中 各 估计 的 标准 差 依次 是 0.001 7. 0.000 013. 0.014 4， 参 数 的 
估计 值 与 前 面 的 GARCH(1,1) 模型 很 接近 , 但 这 两 个 模型 间 有 一 个 大 的 差别 . 在 
IGARCH(1,1) 模型 下 , a, 的 无 条 件 方差 , 也 即 r 的 无 条 件 方差 , 是 没有 定义 的 . 这 
一 点 对 超额 收益 率 序列 是 难以 验证 的 . 从 理论 观点 看 , IGARCH 现象 可 能 会 是 波动 
率 常 有 的 水 平移 动 所 引起 的 . 波动 率 持续 性 的 真正 原因 值得 仔细 研究 . 

“4a, +H; — 1 Bf, 由 (3.16) RERNE 


os (l) = e$ (1) + (l—1)ao, 121, (3.21) 


Hep on 是 预测 原点 ， 由 此 , 02 (1) 对 将 米 波动 率 的 效应 也 是 持续 的 , 230] 4 OL 
成 了 一 个 斜率 为 ao 的 直线 . Nelson(1990) 研究 了 在 IGARCH 模型 下 波动 率 过 程 
oz 的 某 些 概率 性 质 . 过 程 o? 是 一 个 识 , 它 在 文献 中 有 一 些 漂亮 的 结果 可 用 . 在 一 
些 条 件 下 , 波动 率 过 程 是 严 平稳 的 , 但 不 是 弱 平 稳 的 , 这 是 因为 它 的 前 两 阶 矩 不 存 
在 . 

在 研究 IGARCH(1,1) 模型 时 , ao = 0 的 情形 是 特别 令 人 感 兴趣 的 . 这 时 , 对 所 
有 预测 步 长 , 波动 率 的 预测 值 都 是 02 (1), 参见 (3.21) 式 . 这 个 特殊 的 IGARCH(1,1) 
模型 正 是 风险 度量 系统 RiskMetrics 所 用 的 波动 率 模型 , 这 个 系统 是 一 种 计算 风险 
{Hi (Value at Risk) 的 方法 ( 见 第 7 章 ). 该 模型 也 是 序列 (a2) 的 指数 平滑 模型 为 
说 明 这 点 , 将 模型 改写 为 


c; = (1— &1)at 1 - hog. i 
= (1— /1)az. 4 + /A[(1 = 8)az..9 + Biokal) 
= (1— B,)a?_,; + (1 — 1) Pia?_» + Peo? 3 
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重复 迭代 得 到 
at = (1 — Bi)(at + Biata + Bass +--+), 


这 就 是 著名 的 贴现 因子 为 fi 的 指数 平滑 公式 . 因此 , 指数 平滑 方法 可 以 用 来 估计 
这 样 一 个 IGARCH(1, 1) 模型 . 


3.7 GARCH-M 模型 


在 金融 中 , 证 券 的 收益 率 会 依赖 于 它 的 波动 率 . 为 了 给 这 种 现象 建 模 人 们 会 
考虑 GARCH-M 模型 , 其 中 “MY 表示 收益 率 的 条 件 均值 为 GARCH(GARCH in 
the mean). 简单 的 GARCH(1,1)-M 模型 能 写成 


fi u+ co? Far Gt = O72, 


o? = ao + aja? 1 十 fia? 4, (3.22) 


其 中 请 和 “是 常数 , 参数 < 叫做 风险 溢价 参数 . c 为 正 值 意味 着 收益 率 与 它 的 波动 
率 成 正 相 关 . 文献 中 还 出 现 过 其 他 一 些 具 体 的 风险 溢价 的 形式 , U re = pp + cor +a, 
Al r, = p clno? +a. 

(3.22) 式 的 GARCH-M 模型 蕴涵 着 收益 率 序列 re 存在 序列 相关 性 . 这 种 序列 
相关 性 是 由 波动 率 过 程 {o?} 的 序列 相关 性 导致 的 . 风险 溢价 的 存在 是 历史 股票 收 
益 率 具 有 序列 相关 性 的 另 一 种 原因 . 

为 了 说 明 GARCH-M 模型 的 应 用 , 我 们 考虑 给 S&P500 指数 从 1926 年 1 月 
至 1991 年 12 月 的 月 超额 收益 率 拟 合 一 个 GARCH(1,1)-M 模型 , 并 假定 该 模型 的 
新 妃 服 从 高 斯 分 布 . 所 拟 合 的 模型 为 


Te = 0.005 5 + 1.090? + as, 
of = 8.76 x 1075 + 0.123a?_, + 0.84902 ,, 


其 中 均值 方程 中 两 个 参数 的 标准 误差 分 别 为 0.002 3 和 0.818, 波动 率 方程 中 三 个 
参数 的 标准 误差 分 别 是 2.51 x 10-5, 0.020 5 和 0.019 6. 该 指数 收益 率 的 风险 溢价 
的 估计 值 是 正 的 , 但 在 5% 的 水 平 下 不 是 统计 显著 的 . 这 里 的 结果 由 S-Plus 得 出 . 
X 3-2 给 出 了 S-Plus 中 GARCH-M 模型 的 一 些 其 他 具体 形式 . 风险 游 价 的 思想 也 
可 应 用 于 其 他 GARCH 模型 . 


表 3-2 S-Plus 中 所 允许 的 GARCH-M 的 具体 形式 * 


g(ai) fitr 令 

a? var.in.mean 

Ot sd.in.mean 
In(o?) logvar.in.mean 


a 均值 方程 是 re = p+ eglor) + at. 
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S-Plus 演示 


> sp.fit = garch(sp~l+var.in.mean,~garch(1,1)) 
> summary (sp.fit) 
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为 了 克服 GARCH 模型 在 处 理 金 融 时 间 序 列 时 的 一 些 弱 点 , Nelson(1991) 提出 
了 指数 GARCH(EGARCH) 模型 . 具体 地 , 为 了 允许 在 模型 中 体现 正 的 和 负 的 资产 
收益 率 的 非 对 称 效 应 , 他 考虑 加 权 的 新 息 : 


g (Er) = Ger + 7 [lee] — E (le:l)] , (3.23) 


其 中 0 和 17 是 实 常数 . s 和 [e| —E (ler) 都 是 零 均 值 的 独立 同 分 布 序列 , 上 且 有 连续 
的 分 布 . 因此 , E [g (et)] — 0. g (er) 的 非 对 称 性 容易 从 下 式 看 出 : 


s= (0 +7) £i — YE (Jeil), 3$ e, 2 0, 
(0 — 7) er — YE (|e), ter « 0. 


注释 ”对 标准 高 斯 随机 变量 c, E (le) = V2/T. 对 (3.7) 式 中 的 标准 化 学 生 -t 
分 布 , 我 们 有 
E(led) = 2Vu— 2T (v +1) /2) 

(v — 1) P (v/2) fx 
EGARCH(m, s) 模型 能 写成 
8—1 

Er ner gle), (3.24) 
其 中 ao 是 常数 , B 是 向 后 推移 算 子 使 得 Bg (er) = g ler), 13-A B+ 8, 4B571 
和 1 一 4B 一 … 一 QamB™"m 是 多 项 式 , 它们 的 根 都 在 单位 圆 外 且 没 有 公 因 子 . 根 在 单 
位 圆 外 , 意味 着 根 的 模 大 于 1. (3.24) 式 又 一 次 用 通常 的 ARMA 参数 化 形式 来 描述 
a, 的 条 件 方差 随时 间 的 演变 . 基于 这 个 表示 , EGARCH 模型 的 一 些 性 质 可 以 用 与 
对 GARCH 模型 所 用 的 类 似 方 法 得 到 , 例如 In (o2). 的 无 条 件 均值 为 ao. 然而 , 这 
个 模型 在 如 下 几 点 上 与 GARCH 模型 不 同 ; 第 一 , 它 使 用 条 件 方差 的 对 数 , 放松 了 
对 模型 系数 非 负 性 的 限制 ; 第 二 , g (zt) 的 使 用 , 使 得 对 a, 的 正 的 和 负 的 延迟 值 , BE 
型 的 反应 不 对 称 . EGARCH 模型 的 其 他 性 质 可 在 Nelson(1991) 中 找到 . 

为 了 更 好 地 理解 EGARCH 模型 , 我 们 考虑 阶 为 (1,1) 时 的 简单 情形 : 


ay = Otét, (1 = aB) In (o?) = (1 — a) ag + g (er_1) , (3.25) 


其 中 {e} 是 独立 同 分 布 标准 正 态 序列 , o. A FERRAT. 在 这 种 情形 下 , E (letl) 一 
V2/r In (e?) 的 模型 变 成 


a;— 98,6, ln (a7) — ag 


(1 — aB)In (c2) = 


| a. + (y+ 9) £11, 当 et 20 时 ， (3.26) 


a.+(y-OA)(—-e-1) 当 s <0 时， 
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其 中 o, = (1 一 Q) ag — /2/zy. 这 是 一 个 非 线性 函数 , 类 似 于 Tong(1978, 1990) 中 
的 门限 自 回归 (TAR, threshold autoregressive) 模型 . 这 里 我 们 只 要 知道 : 对 这 个 简 
单 的 EGARCH 模型 来 说 , 条 件 方差 以 非 线 性 方式 依赖 于 ai 的 符号 . 具体 地 说 ， 
我 们 有 


2 2o Tti 


sloso = | 当 qs_1 > 0 时 ， 


et = oT1 exp (as) 
Q4— 
ev [n-n e 1 当 at « 0 WY, 
Ogi 


系数 (7 +0) 和 (y — 0) 表明 模型 对 正 的 和 负 的 w_i 的 非 对 称 响应 . 因此 , 当 0 关 0 
时 模型 是 非 线 性 的 . 由 于 负 的 扰动 往往 带 来 更 大 的 影响 , 我 们 假定 0 是 负 的 . 对 高 
阶 EGARCH 模型 来 讲 , 非 线性 性 变 得 复杂 得 多 . Cao 和 Tsay(1992) 利用 非 线 性 模 
型 , 包括 EGARCH 模型 , 得 到 向 前 多 步 波 动 率 的 预报 . 第 4 章 将 讨论 金融 时 间 序 
列 的 非 线 性 性 . 


3.8.1 ”模型 的 另 一 种 形式 
EGARCH(m, s) 模型 的 另 一 种 形式 为 


Q4—i| T ^fid4—i e 
weD-a + Salt Sieh), GD) 
1-1 deis j=1 


这 里 , 正 的 ar; 对 对 数 波动 率 的 贡献 为 o (1. + )ler—il, 而 负 的 ari 对 对 数 波动 率 
的 贡献 为 oi(1 — i) |£e-il; Hrp Ei—i 一 Gii ei—i- 参数 Yi 表示 at—i 的 杠杆 效应 . 在 
实际 应 用 中 , 我 们 仍然 假定 y; 为 负 的 . 这 是 S-Plus 中 所 用 的 模型 形式 . 

3.8.2 ”实例 说 阴 


Nelson(1991) 把 EGARCH 模型 应 用 到 价值 加 权 市 场 指数 的 月 超额 收益 率 上 ， 
数据 是 从 证 券 价 格 研究 中 心得 到 的 , 时 间 区 间 是 从 1962 年 7 月 至 1987 年 12 H. 
超额 收益 率 是 用 价值 加 权 指 数 的 收益 率 减 去 国库 券 的 月 收益 率 , 假定 一 个 月 中 每 一 
天 的 国库 券 收 益 率 是 常数 . 共有 6 408 个 观察 值 . 用 ” 表示 超额 收益 率 , 所 用 模型 
为 

Tt = $o + dirti + co? + ap, (3.28) 
1+ 8B 
I aB app? (et-1) " 
其 中 of 是 给 定 Fi 下 oa, 的 条 件 方差 , Ni 是 第 4 一 1 个 交易 日 和 第 t+ 个 交易 日 之 
间 的 不 交易 的 天 数 , ao 和 w 是 实 参 数 , q (61) 由 (3.23) 式 定义 , e, 服从 (3.9) 式 的 
广义 误差 分 布 . 与 GARCH-M UU ABA, (3.28) 式 中 的 参数 c 是 风险 溢价 参数 . K 


In (e?) = ag 4- In (1 4-w Nj) + 


3.8 指数 GARCH 模型 ”111 


3-3 给 出 了 模型 的 参数 估计 值 和 它们 的 标准 误差 . (3.28) 式 的 均值 方程 有 两 条 性 质 
值得 注意 : 第 一 , CA AR(1) 模型 来 刻画 超额 收益 率 中 的 序列 相关 性 ; 第 二 , 它 用 
波动 率 o? 作为 回归 变量 来 解释 风险 溢价 . 所 估计 出 的 风险 溢价 是 负 的 , 但 是 统计 
不 显著 的 ， 


A 3-3 ”对 价值 加 权 CRSP 市 场 指数 的 日 超额 收益 率 估计 出 的 AR(1)-EGARCH(2, 2) 
Bs. 数据 是 从 1962 年 7 月 至 1987 年 12 月 


参数 ao w Y a a2 B 
估计 值 一 10.06 0.183 0.156 1.929 一 0.929 一 0.978 
标准 误差 0.346 0.028 0.013 0.015 0.015 0.006 
参数 0 do $i c v 
估计 值 一 0.118 3.5 x 1074 0.205 —3.361 1.576 
标准 误差 0.009 9.9 x 1075 0.012 2.026 0.032 
3.8.3 ” 另 一 个 例子 


作为 另 一 个 说 明 , 我 们 来 考虑 IBM 股票 从 1962 年 1 A 1997 年 12 月 的 月 
对 数 收益 率 , 共 864 个 观察 值 . 拟 合 一 个 AR(1)-EGARCH(1,1) 模型 : 


re = 0.010 5+ 0.092r¢_) + a4, Gy = e&t, (3.29) 
1 
In (a?) = —§.496 + T0868 6-0 : 
g (£11) = —0.079 56,1 + 0.264 7 [T - V2/7| : (3.30) 


其 中 {e,} 是 一 列 独立 的 标准 高 斯 随机 变量 . 所 有 参数 估计 值 在 5% 水 平 下 都 是 统 
计 显 著 的 . 至 于 模型 的 检验 , 标准 化 的 残 差 过 程 a, = a/o 的 Ljung-Box 统计 量 为 
Q (10) = 6.31 (0.71) 和 Q (20) = 21.4 (0.32), 而 对 平方 过 程 a2, Q (10) = 4.13 (0.90) 
和 Q (20) = 15.93 (0.66), 括号 中 的 数 是 p 值 . 因此 , 在 所 拟 合 模型 的 残 差 序列 中 没 
有 序列 相关 性 或 条 件 异 方差 性 , 这 说 明 所 拟 合 的 模型 是 充分 的 . 

由 估计 出 的 波动 率 方程 (3.30) 式 , 并 利用 V2/r = 0.797 9, 我 们 得 到 波动 率 方 
程 为 
0.185 2-1, H e1 20h, 


In (o7) = —1.001 + 0.856 In (o2 4) + | -0.344 26-1, era c ORT 
作 一 个 反对 数 变换 , 我 们 有 


0.185 26,1 ` " 
o2 一 g2x0.856,-1.001 六 c dus 3 6, 120 RJ, 

t7 94151 id ^ 
eg 9343531 3X6 «0H. 


此 方程 说 明了 在 EGARCH 模型 下 波动 率 对 过 去 正 的 和 人 负 的 “扰动 ” 的 反应 不 对 称 . 
例如 , 当 标 准 化 的 “扰动 ” 扰动 两 个 单位 ( 即 两 个 标准 差 ) 时 ， 
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of (st-1 一 一 2) — exp[-0.344 2 x (—2)] 
of (er-1—2)  exp(0.185 2 x 2) 


因此 , 变动 两 个 标准 差 的 负 “ 扰 动 ” 对 波动 率 的 影响 要 比 相同 强度 的 正 “ 扰 动 ” 的 
影响 高 37.496. 这 个 例子 清楚 的 显示 出 EGARCH 模型 的 非 对 称 特征 ， 一 般 来 说 . 
“扰动 ” BK, 正 负 “扰动 ”对 波动 率 的 影响 的 差别 就 越 大 . 

最 后 , 我 们 将 样本 区 间 进 行 扩展 , 使 其 包含 1998 年 到 2003 年 的 对 数 收益 率 ， 
共有 936 个 观测 . 我 们 用 S-Plus 拟 合 一 个 EGARCH(1, 1) 模型 , 结果 如 下 . 


S-Plus 演示 
输出 结果 . 


> ibm.egarch-garch(ibmln-1,-egarch(1,1),leverage-T, 
+ cond.dist=’ ged’ ) 


=e = 1,374. 


> summary (ibm.egarch) 

Call: 

garch(formula.mean = ibmln ~ 1, formula.var = ~ egarch(1,1), 
leverage - T,cond.dist - "ged") 


Mean Equation: ibmln - 1 

Conditional Variance Equation: ~ egarch(1, 1) 

Conditional Distribution:  ged 

with estimated parameter 1.5003 and standard error 0.09912 


Value Std.Error t value Pr(>|t|) 
.01181 20.002012 5.870 3.033e-09 
.55680 0.171602 -3.245 6.088e-04 
0.052824 4.169 1.669e-05 
.92910 20.026743 34.742 0.000e«00 
0.126096 -2.094 1.828e-02 


———— — — — — — É— ee a omo ww ww ew woe ee RO E REST ETT 


Statistic P-value Chi^2-d.f. 
17.87 0.1195 12 


Ljung-Box test for squared standardized residuals: 


o — e  - "P a o9 o od» ur quam m cm o) i VF de eo m b ab Ge aD Ani A qb Ap d ep qp cm D P AU RP nanana 


Statistic P-value Chi^2-d.f. 
6.723 0.8754 12 


UAH GARCH(1, 1) 模型 为 


re = 0.011 8+ ai ay =orer, 


las | — 0.264a, 4 


In(a?) = —0.557 + 0.220 
: Ot-1 


+ 0.929 In(o?_,), (3.31) 
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其 中 e, 服从 参数 为 1.5 的 GED 分 布 . 基于 模型 残 差 及 其 平方 的 Ljung-Box 统计 量 
表明 模型 是 充分 的 . 正如 所 预料 的 那样 , 输出 结果 表明 : 估计 出 的 杠杆 效应 是 负 的 ， 
并 且 在 5% 的 显著 性 水 平 下 是 统计 显著 的 , t- 比 是 —2.094. 


3.8.4 FA EGARCH 模型 进行 预测 


我 们 用 EGARCH(1,1) 模型 来 说 明 EGARCH 模型 的 向 前 多 步 预测 . 假定 模型 
的 参数 已 知 , 新 息 服从 标准 高 斯 分 布 , 我 们 有 


In (af) = (1 — 01) eo + 4 In (of 1) +g (6-1); 


g(&1-1) 三 Oct 十 了 (le = v2/z) . 
两 边 取 指 数 , 模型 变 成 


2o 


ot = 0;°} exp [(1 — 01) ao] exp [g (Er-1)] , 


g (st-1) = 051 + Y (lel = V2/n) ; (3.32) 
设 h 是 预测 原点 , 对 问 前 1 步 预测 , 我 们 有 
2a, 


Thai = 05 exp [(1 — a1) au] exp [g (en)], 


其 中 右边 的 所 有 量 都 是 已 知 的 . 因此 以 h 为 预测 原点 的 向 前 1 步 的 波动 率 预 测 是 
82 (1) = oky of,, 由 上 式 给 出 . 对 向 前 2 步 预 测 , (3.32) 式 给 出 


05.12 = 0545 exp [(1 — a1) ao] exp [g (En41)] - 
在 六 时 刻 取 条 件 期 望 , 我 们 有 
65 (2) = R” (1) exp [(1 — a1) ao] En {exp [g (En+1)]} 
其 中 E, 表示 在 时 间 原 点 h 所 取 的 条 件 期 望 . 上 述 期 望 可 以 由 下 式 得 到 ; 
E{exp[g(e)}}=[ _ exp [õe +> (lel - v2/m)] f(e) de 
=exp (Cava) || «e Fae we se 
=exp (—7v2/n) [e+*/2@ (0 +7) + «97* ^e (7 — 8) , 


其 中 f (e) 和 更 (z) 分 别 表 示 标 准 正 态 分 布 的 概率 密度 函数 和 累积 分 布 函数 . 因此 ， 
向 前 2 步 波动 率 预测 值 为 


erde| 


b 


82 (2) =62™ (1) exp [a — 04) —^ 27n] 
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x {exp [(0 +7)? /2] (6 +7) + exp [( - 7)? /2] 9 ( — 9). 
重复 前 面 的 步骤 , 我 们 得 到 向 前 ) 步 预测 的 递 推 公式 : 
6$ G) - 6$" G—1) exp(w) x {exp |( | >)? 13] 亚 (8+?)+exp [(0—7)? /2] 2-0}, 


KP w = (1 — ay) a9 — y\/2/x. 9 (0 4- 5) I © (y— 6) 的 值 可 以 从 统计 软件 包 中 得 
到 . 另外 , 可 用 第 6 章 附录 B 中 的 方法 得 到 这 些 值 较 精 确 的 近似 . 

作为 例子 , 考虑 3.8.3 节 为 IBM 股票 月 对 数 收 益 率 (时 间 终 点 是 1997 年 12 
H) 建立 的 AR(1)-EGARCH(1,1) 模型 . 利用 所 建立 的 EGARCH(1.1) 模型 , 可 以 
计算 该 序列 的 波动 率 预测 . 在 预测 原点 + = 864, 预测 值 是 Gee, (1) = 6.05 x 10-3, 
5864 (2) = 5.82 x 1073, 62,4 (3) = 5.63 x 10-?, 62,4 (10) = 4.94 x 10-3. 这 些 预 测 值 
逐步 收敛 到 (3.20) 式 中 的 “扰动 ”过 程 的 样 木 方差 4.37 x 10-3. 


3.9 门限 GARCH 模型 


男 外 一 个 经 常用 来 处 理 杠 杆 效 应 的 波动 率 模型 是 门限 GARCH 模型 (或 
TGARCH 模型 ), 可 参见 Glosten, Jagannathan 和 Runkle(1993) 以 及 Zakoian(1994). 
一 个 TGARCH(m, s) 模型 假定 : 


s m 
o? = Ap + S (ai 十 yi Nizi jati -+ 8,02 5 (3.33) 
i=1 j=1 


其 中 Ne 是 关于 负 Qt 一 的 指示 变量 ， Bi 


l, Ai api < 0, 
Na = 
0, 4 ai >0, 


os, y; 和 8; 为 非 负 参 数 , 满足 类 似 于 GARCH 模型 的 条 件 . 从 模型 中 可 以 看 出 正 的 
ati 对 of WITA aia? i 而 负 的 aci 对 cz 有 更 大 的 页 献 (ai 十 i)a p 其 中 
y > 0. 该 模型 用 0 作为 门限 来 分 隔 过 去 扰动 的 影响 . 也 可 以 用 其 他 的 一 些 门限 值 ， 
参见 第 4 章 门限 模型 的 一 般 概 念 . 模型 (3.33) 也 称 为 GJR HAY, 因为 Glosten 等 
人 (1993) 实质 上 给 出 了 同样 的 模型 , 

作为 例子 ,考虑 IBM 股票 从 1926 年 到 2003 年 的 月 对 数 收益 率 . 拟 合 的 
TGARCH(1, 1) 模型 如 下 : 


re = 0.012 1+ At, Ut = OtEt, 
of = 3.45 x 1074 + (0.065 8 + 0.084 3N,_1)a?_, + 0.818 202, 


其 中 新 息 服 从 GED 分 布 , 所 估计 的 GED 分 布 的 参数 为 1.51, 标准 误差 为 0.099. 
均值 方程 参数 估计 的 标准 误差 是 0.002, 波动 率 方程 参数 估计 的 标准 误差 分 别 是 


(3.34) 
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1.26 x 1074, 0.031 4, 0.039 5 和 0.049. 为 检验 所 拟 合 的 模型 , 对 标准 化 的 残 差 a 有 
Q(12) = 18.34(0.106). 对 a2 有 Q(12) = 5.36(0.95)， 从 而 模型 对 对 数 收 益 率 的 前 两 
阶 条 件 矩 的 建 模 是 充分 的 . 基于 所 拟 合 的 模型 . 村 杆 效应 在 5% 的 显著 性 水 平 下 是 
显著 的 . 


所 用 到 的 S-Plus 命令 
> ibm.tgarch = garch(ibmln~1,~tgarch(1,1),leverage=T, 
+ cond.dist-'aed') 
> summary (ibm.tgarch) 
> plot (ibm.tgarch) 


比较 为 TBM 股票 的 对 数 收 益 率 所 建立 的 (3.31) 式 和 (3.34) 式 会 发 现 这 两 个 
模型 是 很 有 意思 的 . 假定 a1 = +2041, 于 是 e_l = +2. 由 EGARCH(1, 1) 模型 
可 得 


aË (eri = —2) _ 0.22x2x0.632 ~ 1 964 
oF (Et = 2) | 


5 方面 , 忽略 掉 常 数 项 0.000 345, 由 TGARCH(1, 1) 模型 得 
a? (€e-1 =—2) _ [(0.065 8 + 0.084 3)4 十 0.818 2]c2 , 


c(e.-1—2) ^  (00658x4--08182)02, 17 
这 两 个 模型 给 出 了 相似 的 杠杆 效应 . 


3.10 CHARMA 模型 


人 们 在 文献 中 已 经 提出 很 多 其 他 的 经 济 模型 来 描述 (3.2) 式 中 条 件 方差 0? 的 
演变 . 我 们 介绍 一 下 条 件 异 方差 ARMA(CHARMA) 模型 . 此 模型 是 用 随机 系数 来 
产生 条 件 异 方差 性 ( 见 Tsay(1987)). CHARMA 模型 与 ARCH 模型 不 同 , 但 这 两 个 
模型 有 相似 的 二 阶 条 件 性 质 CHARMA 模型 定义 为 


Tt — [up = tat oo 2 二 OmtGr_m +m, (3.35) 


其 中 {wh} 是 均值 为 零 、 方 差 为 o2 的 高 斯 白 噪声 序列 {64} = {(614,… m) 是 
一 刻 独 立 同 分 布 的 随机 向 量 序列 , 其 均值 为 0、 协 方差 阵 为 非 负 定 阵 0, 并 且 {6,} 
与 (m) 独立 . 本 节 将 用 向 量 与 矩阵 运算 的 一 些 基 本 性 质 来 简化 叙述 . 读者 可 以 参 
考 第 8 章 的 附录 A. 在 此 对 这 些 性 质 作 一 些 简短 的 回顾 . 对 m > 0, 模型 可 写成 


at = G4 164+, 


其 中 ay = (ai ,qr_m) 是 的 延迟 值 构成 的 向 量 , 在 € — 1 时 刻 是 已 知 的 . 
从 而 , (3.35) 3Xff] CHARMA 模型 中 o, 的 条 件 方差 为 


oF E 0; + a, Cov (01) ayy = oz T (a4—1; — ;1 m) Q (a1 4,777 dil. (3.36) 
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id 2 的 第 (4, 3) 个 元 素 为 wi;. 因为 矩阵 是 对 称 的 , 故 wi; = wa d$ m = 1, Ml) (3.36) 
式 简化 为 o? = 02 + wna; i, 这 是 一 个 ARCH(1) 模型 . 若 m = 2, (3.36) 式 变 为 


2 2 2 s 2 
gt = On T w118; 4 十 2w12Qt-1Qt-2 + W220; 5, 


这 不 同 于 ARCH(2) 模型 , 因为 有 交叉 乘积 项 a,_1a:_2. 一 般 地 , FO 为 对 角 阵 , 则 
CHARMA (m) 模型 的 条 件 方差 等 于 一 个 ARCH(m) 模型 的 条 件 方差 . 因为 Q 是 协 
方差 阵 , 它 是 非 负 定 的 , 而 o2 是 方差 、 是 正 的 , 故我 们 有 02 > o? > 0 对 任何 上 成 
x. 换 句 话说 , 在 CHARMA 模型 下 o? 自动 地 是 正 数 . 

ARCH 和 CHARMA 模型 的 明显 区 别 是 后 者 在 波动 率 方 程 中 有 a 的 延迟 值 的 
交叉 乘积 项 . 这 些 交 叉 乘 积 项 在 一 些 应 用 中 会 有 用 . 例如 , 在 资产 收益 率 建 模 中 , 交 
叉 乘 积 项 表示 前 面 的 收益 率 的 相互 作用 . 可 以 想象 , 股票 波动 率 依 赖 于 这 些 相 互 作 
H. 然而 , 交叉 乘积 项 的 个 数 随 着 阶 m 迅速 增加 , 因此 需要 某 些 限制 以 使 模型 简单 . 

- 些 可 能 的 限制 是 在 CHARMA 模型 中 只 用 少数 交叉 乘积 项 . ARCH 和 CHARMA 
模型 的 另 一 个 区 别 是 : 高 阶 CHARMA 模型 的 性 质 比 ARCH 模型 的 性 质 更 难得 到 ， 
这 是 因为 处 理 多 元 随 届 变量 比较 困难 . 

作为 例子 , 我 们 对 前 面 GARCH 建 模 已 用 的 S&P500 指数 的 月 超额 收益 浴 建 

立 一 个 CHARMA 模型 ; 


T, = Potas t= rar 1 + iat + Me: 
所 拟 合 的 模型 为 
re = 0.006 35+ as, 02 = 0.001 79 + (a« 1,042) € (aq 1,04 2)! , 


其 中 
o 0.141 7 (0.033 3) —0.059 4 (0.036 5) 


~ | —0.059 4 (0.036 5) 0.308 1 (0.034 0) 


括号 中 的 数 是 标准 误差 . 9 的 交叉 乘积 项 的 七 比 为 —1.63, 它 是 在 10% 的 水 平 下 
边际 显著 的 . 如 果 我 们 把 模型 改进 为 


> 


T, = Qo t+ Qe, Ge = 01,011 4-031042 十 063t0t 3 + Nts 
但 假定 33, 与 (Sre, doe) 是 不 相关 的 , 则 我 们 得 到 的 拟 合 模型 为 
re = 0.006 8+ at, o? — 0.001 36 4- (a4 1,04 2,013) £2 (a4 1,04 2,04 3) , 
其 中 0 的 元 素 及 其 标准 误差 (在 括号 中 给 出 ) 为 
0.121 2 (0.035 5)  —0.062 2 (0.028 3) 0 | 


Q = | —0.062 2(0.028 3) — 0.191 3(0.025 4) 0 


0 0 0.298 8 (0.042 0) 
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所 有 的 估计 值 在 5% 的 水 平 下 是 显著 的 . 对 该 模型 , a, — n, — 0.006 8 是 月 超额 收益 
率 与 它 的 平均 值 的 偏离 ， 所 拟 合 的 CHARMA 模型 说 明 前 两 个 延迟 值 之 间 存 在 其 
种 相互 作用 . 实际 上 , 波动 率 方程 可 近似 地 写成 


ot = 0.001 36 + 0.12a?. 1 一 0.12at_iat_ 2 十 0.19a2 ,+ 0.30a2 ,. 


当 Q1—104—2 为 负 时 , 条 件 方差 要 稍 大 一 些 . 
解释 变量 的 效应 


我 们 很 容易 把 CHARMA 模型 推广 , 使 得 模型 中 w 的 波动 率 依赖 于 某 些 解释 
变量 . BE (ma); , 是 t+ 时 刻 可 观测 的 m 个 解释 变量 . 考虑 模型 
Tt = Ht + 04, at = D Outin 十 Th. (3.37) 
其 中 6; (St Ome) 和 是 (3.35) 式 中 定义 的 随机 向 量 和 随机 变量 . MBA, ay 
的 条 件 方 差 为 


cz = 0; T (214—177 Tma-1) 8 (r1 Lvs Zma-1). 


在 实际 应 用 中 , 解释 变量 可 能 会 包含 at 的 某 些 延迟 值 . 


3.11 随机 系数 的 自 回 归 模 型 


文献 中 , 随机 系数 自 回归 (random coefficient autoregressive, RCA) 模型 是 为 了 
考虑 不 同体 制 间 的 变化 而 提出 的 , 类 似 于 计量 经 济 学 中 的 面板 数据 分 析 (panel data 
analysis) 利 统计 学 中 的 分 等 级 模型 (hierarchical model). 我 们 把 RCA 模型 当 作 条 
件 异 方差 模型 来 阐述 , 但 历史 上 , 它 是 通过 允许 参数 随时 间 演 变 来 得 到 过 程 的 条 件 
均值 方程 的 更 好 描述 . 称 时 间 序 列 {re} 服从 RCA(p) 模型 , 如 果 {r,} 满足 


p 
rt = Oo + 2 (bi + it) ri i-a, (3.38) 
AT 
JP p 是正 整数 , {6 = {(644,… 89) ) 是 一 列 独立 的 均值 为 0、 协 方差 阵 为 9; 
的 随机 向 量 , 且 (6,) 与 {a,} 是 独立 的 . 关于 该 模型 的 更 详细 的 讨论 , 参见 Nicholls 
和 Quinn(1982). (3.38) 式 中 的 RCA 模型 的 条 件 均值 和 条 件 方差 为 


p 
p, = E (ri |F) = bot >, Peis OF = OF (ricis Tep) Ms (Tay Tip) 
与 CHARMA 模型 形式 上 相同 . 但 RCA 和 CHARMA 模型 间 存 在 微妙 的 差别 : 对 
RCA 模型 , 波动 率 是 观察 到 的 延迟 值 rei 的 二 次 函数 , 而 在 CHARMA 模型 中 . y 
动 率 是 延迟 的 新 息 a, 的 二 次 函数 . 
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3.12 ”随机 波动 率 模型 


另 一 种 描述 金融 时 间 序 列 波动 率 演变 的 方法 是 : 对 m 的 条 件 方差 方程 引进 一 
个 新 息 . 具体 讨论 可 参见 Melino 和 Turnbull(1990), Taylor(1994), Harvey, Ruiz 和 
Shephard(1994), Jacquier, Polson 和 Rossi(1994). 结果 得 到 的 是 随机 波动 率 模型 . 
与 BGARCH 模型 相似 , 为 了 保证 条 件 方差 为 正 的 , SV 模型 用 In (oz) 而 不 是 of. 
SV 模型 定义 为 


at=0et, (1—a,B—---—amB™)In(o7) = ao + tt, (3.39) 


其 中 e, 独 立 同 分 布 且 服从 N (0, 1), ve 独立 同 分 布 且 服 从 N (0,07). E {et} 和 {wx} 
是 相互 独立 的 , ao 是 常数 , 多 项 式 1 一 > o, B* 的 所 有 根 的 模 大 于 1. 引进 新 息 ve 
很 大 程度 地 增加 了 模型 的 灵活 性 , 但 也 增加 了 参数 估计 的 困难 . 为 了 估计 SV 模型 
我 们 需要 通过 Kalman 滤波 或 者 Monte Carlo 方法 来 应 用 伪 似 然 (quasi-likelihood) 
方法 ，Jacquier, Polson 和 Rossi(1994) 给 出 了 伪 似 然 和 Monte Carlo 马尔 可 夫 链 
(MCMC) 方法 的 估计 结果 之 间 的 比较 . 估计 SV 模型 比较 困难 是 可 以 想象 的 , 因为 
此 模型 中 用 了 两 个 新 息 o 和 wi. 第 12 章 将 讨论 一 个 MCMC 方法 去 估计 SV 模 
型 . 关于 随机 波动 率 模型 的 讨论 , 请 参考 Taylor(1994). 

Jacquier, Polson 和 Rossi(1994) 的 附录 中 给 出 了 一 些 SV 模型 当 m = 1 时 的 
TERR. 例如 , 4 m — 1 时 ， 

In (a?) ~ x( = E =N (stn, 07) s 


j 2 
l—o; 1 — ai 


H E (a?) = exp [un 十 c2/2], E (a1) = 3éxp [242 一 201], 和 corr (a2,02...) 一 
[exp (cgai) — 1] / [Bexp (oj) — 1]. 限定 在 一 定 范围 内 的 经 验 告诉 我 们 ，SV 模型 
常常 在 模型 的 拟 合 上 有 改进 , 但 在 样本 以 外 的 波动 率 预测 上 与 其 他 模型 相 比 却 时 好 
时 坏 . 


3.13 ”长 记忆 随机 波动 率 模 型 


最 近 , 有 人 利用 分 数 差 分 方法 , 进一步 推广 了 SV 模型 , 允许 波动 率 有 长 记忆 
PE. 正如 第 2 章 所 讨论 的 , 一 个 时 间 序 列 是 一 个 长 记忆 过 程 , 如 果 当 间隔 增加 时 自 
HAAA URRA (而 不 是 以 指数 速度 ) 衰减 . 在 波动 率 的 碘 究 中 引进 长 记忆 模型 
的 动机 是 这 样 一 个 事实 : 虽然 资产 收益 率 序 列 本 身 没 有 序列 相关 性 , 但 收益 率 的 绝 
对 值 或 平方 序列 的 自 相关 函数 常常 衰减 很 惕 , 参见 Ding, Granger 和 Engle(1993). 
图 3-9 所 示 的 是 IBM 股票 和 S&P500 指数 从 1962 年 7 月 3 日 至 2003 年 12 H 31 
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日 的 日 收益 率 绝对 值 序列 的 样本 自 相关 函数 .这 两 个 样本 ACF 都 是 正 的 , 取 值 大 
小 中 等 , 但 衰减 很 慢 . 


(a) S&P 500 指数 


Ü 50 100 150 200 
间隔 


(b) IBM 股票 收益 率 


() 50 100 150 200 


间隔 
图 3-9 S&P500 指数 和 TBM 股票 日 对 数 收益 率 绝对 值 序列 的 样本 ACF, 时 间 区 间 是 1962 年 
7 H3 日 至 2003 年 12 月 31 日 .两 个 水 平 虚线 表示 渐 近 的 5% KEHE. FR 


简单 的 长 记忆 随机 波动 率 (LMSV) 模型 可 写成 
Qt = G4£4, OF = g exp (u;,/2), (1 — By! u, = Th. (3.40) 
其 中 o > 0, e, 独立 同 分 布 服从 NN (0, 1), m 独立 同 分 布 服从 N (0,02) FRI e, 相互 


独立 , 0 < d < 0.5. 长 记忆 的 特征 源 于 分 数 差 分 (1 — B)", 它 可 推出 u 的 ACF 以 
PAR (而 不 是 以 指数 函数 ) 衰减 . 对 模型 (3.40), 我 们 有 


In (a2) = In (e?) + u, + In (e?) 
= [In (e?) + E (Ine?)] + p + [In (e?) - E (Ine?)] = + pe + er. 


这 样 , In (a?) 序列 是 一 个 高 斯 长 记忆 过 程 加 上 一 个 非 高 斯 白 噪 声 见 Breidt Crato 
和 de Lima(1998). 长 记忆 随机 波动 率 模 型 的 估计 很 复杂 , 但 分 数 差分 参数 4 是 可 以 
用 伪 最 大 似 然 法 或 回归 方法 来 估计 的 ， 对 S&P500 指数 中 运用 的 公司 股票 的 日 收 
wE, 取 平 方 后 再 取 对 数 , 利用 这 样 的 一 些 序列 , Bollerslev 和 Jubinski(1999), Ray 
和 Tsay(2000) 发 现 d 的 中 位 数 估计 约 为 0.38. Ray 和 Tsay(2000) 以 各 种 不 同 特征 
对 公司 进行 分 类 , 研究 了 各 类 公司 股票 的 日 波动 率 的 共同 的 长 记忆 成 分 . 他 们 发 现 
同一 行业 公司 会 有 更 趋 相同 的 长 记忆 成 分 (例如 , 美国 大 的 国有 银行 和 金融 机 构 )， 


3.14 应 用 


本 节 中 , 我 们 运用 本 章 讨 论 过 的 波动 率 模型 来 研究 有 实际 重要 性 的 一 些 问 题 
所 用 数据 是 从 1926 年 1 月 至 1999 年 12 月 的 IBM 股票 和 S&P500 指数 的 月 对 数 
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收益 率 . 共有 888 个 观察 值 , 收益 率 以 百分比 形式 给 出 并 包括 了 分 红 . 图 3-10 所 示 
的 是 这 两 个 收益 率 序列 的 时 间 图 . 注意 到 该 节 的 结果 都 是 用 RATS 程序 得 到 的 . 


(a) IBM 


petits 
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图 310 IBM 股票 和 S&P500 指数 月 对 数 收益 率 的 时 间 图 , 样本 时 间 段 是 从 1926 年 1 月 至 
1999 年 12 月 . 收益 率 以 百分比 给 出 并 包括 了 分 红 


例 3.4 我们 关心 这 样 的 问题 ， 是 寿 一 支 股票 的 日 波动 举 在 夏季 比较 低 ? 如 果 是 ， 
低 多 少 ? 对 这 两 个 问题 肯定 的 回答 在 股票 期 权 定 价 中 有 实际 意义 . 我 们 用 图 3-10a 
所 示 的 TBM 股票 的 月 对 数 收益 率 作 为 例子 来 说 明 怎 样 回答 这 两 个 问题 . 

记 月 对 数 收益 率 为 n 给 数据 拟 合 一 个 高 斯 GARCH(1,1) 模型 : 


Tt = 1.23 + 0.0997, 4 += Gs, Q4 = Et 


> 3.41 
c2 = 3.206 + 0.103a?_, + 0.82507_,. ( ) 
t—1 t 一 1 


均值 方程 中 的 两 个 参数 估计 值 的 标准 误差 分 别 为 0.222 和 0.037, 波动 率 方程 中 三 

个 参数 估计 值 的 标准 误差 分 别 为 0.947, 0.021, 0.037. 对 标准 化 的 残 差 à, = ar/or, 

Ljung-Box 统计 量 为 Q (10) = 7.82 (0.553) 和 Q (20) = 21.22 (0.325), df SPA p fü. 

这 样 , 均值 方程 的 残 差 没有 序列 相关 性 . 而 对 a2, Q (10) = 2.89 (0.98) 和 Q (20) = 

7.26 (0.99), 表明 标准 化 残 差 中 无 条 件 异 方差 性 . 所 拟 合 的 模型 似乎 是 充分 的 , 这 个 

模型 是 进一步 研究 的 出 发 点 . 

为 了 研究 资产 波动 率 的 夏季 效益 , 先 定义 一 个 示 性 变量 : 

" =| 1, 车 t 表示 的 是 六 月 、 七 月 、 八 月 ，; 


m di (3.42) 


并 把 波动 率 方程 修改 为 


2 2 2 2 2 
of = ag + Qiat 4 + B101 + Ut (aoo T a190, 4 + Bioot_1) à 


3:14 应 用 121 


这 个 方程 用 两 个 GARCH(1,1) 模型 来 描述 一 个 股票 收益 率 的 波动 率 : 一 个 模型 针 
对 夏季 的 月 份 , 另 一 个 针对 剩 下 的 月 份 . 对 IBM 股票 的 月 对 数 收益 率 , ouo 和 Bio 
的 估计 值 在 10% 的 水 平 下 是 不 显著 的 , 因此 我 们 对 方程 进行 改进 , 得 到 
rT, = 1.21+0.099r¢_) + at, a4 =ores, 
of = 4.539 十 0.113a2 | + 0.81602 , — 5.154u,. 


均值 方程 中 参数 估计 值 的 标准 差分 别 是 0.218 和 0.037, 波动 率 方程 中 参数 估计 的 
标准 差分 别 是 1.071, 0.022, 0.037 和 1.900. 标准 化 残 差 à, = at/o: 的 Ljung-Box 
统计 量 的 值 为 Q (10) = 7.66 (0.569) 和 Q (20) = 21.64 (0.302), 因此 , 在 标准 化 残 
差 序列 中 没有 序列 相关 性 . 而 对 a2, 其 Ljung-Box 统计 量 为 Q(10) = 3.38 (0.97), 
Q (20) = 6.82 (0.99), 这 表明 在 标准 化 残 差 中 也 没有 条 件 异 方差 性 . 改进 后 的 模型 看 
起 来 是 充分 的 . 

比较 (3.41) 和 (3.43) 式 中 的 波动 率 方程 , 我 们 会 得 出 如 下 结论 . 第 一 , 因为 系 
数 —5.154 与 零 显著 的 不 同 , p 值 为 0.006 7, 从 而 股票 波动 率 的 夏季 效应 在 1% 的 
水 平 下 是 统计 显著 的 . 另外 , 估计 值 的 负 号 证 实 了 IBM 股票 月 对 数 收益 率 的 波动 
率 在 夏季 确实 较 低 . 第 二 , 把 (3.43) 式 中 波动 率 模型 改写 成 

2 | -9.615--0.113a2 1 十 0.816o2 ,, 车 二 是 六 月 、 七 月 、 八 月 份 ， 

WT | 4.539--0.113a2 ,--0.81602 ,， ”其 他 
人 负 常 数 项 —0.615 = 4.539 — 5.154 与 直观 不 一 致 . 然而 , 因为 4.539 和 5.154 的 标准 
误差 相对 较 大 , 估计 值 之 差 —0.615 可 能 不 会 显著 地 不 同 于 0. 为 了 证 实 这 点 , 我 
们 限制 波动 率 方程 中 的 常数 项 对 夏季 月 份 是 0, 然后 重新 拟 合 模型 . 利用 如 下 方程 


of = oa; r + biok a +7(1—w). 


(3.43) 


所 拟 合 模型 为 
re = 1.21+ 0.099r,.., 4 Qt, Ut = ret, 
of = 0.114a?_, + 0.8110?_, + 4.552 (1 — u). 


均值 方程 中 参数 估计 的 标准 误差 分 别 为 0.219 和 0.038, 波动 率 方程 中 参数 估计 
的 标准 误差 分 别 为 0.022, 0.034 和 1.094， 标 准 化 残 差 à, 的 Ljung-Box 统计 量 
Àj Q(10) = 7.68 和 Q(20) = 21.67, a? 的 Ljung-Box 统计 量 为 Q (10) = 3.17 和 
Q (20) = 6.85. 检验 统计 量 的 这 些 值 与 前 面 得 到 的 值 很 靠近 , 在 5% 水 平 下 都 是 不 
显著 的 . 

(3.44) 式 的 波动 率 可 用 来 评价 夏季 效应 在 IBM 股票 波动 率 上 的 体现 ， 作 为 说 
明 , 基于 (3.44) 式 , 对 1999 年 的 IBM 月 对 数 收益 率 来 说 , a? 和 52 的 中 位 数 分 别 是 
29.4 和 75.1. 利用 这 些 值 ,我 们 有 : 对 夏季 月 份 m = 0.114% 29.440.811%75.1 — 64.3, 
对 其 他 月 份 o? = 68.8. 这 两 个 波动 率 之 比 为 64.3/68.8 ~ 93%. 也 就 是 说 , 在 夏季 
月 份 IBM 股票 的 月 对 数 收 益 率 的 波动 率 减 小 7%. 


(3.44) 
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例 3.5 S&P500 指数 在 衍生 产品 市 场 上 被 广泛 应 用 , 因此 对 它 的 波动 率 建 模 是 一 
个 研究 热点 . 此 例 中 , 我 们 所 问 的 问题 是 : 组 成 S& P500 指数 的 单个 股票 过 去 的 收 
益 率 对 该 指数 现在 的 波动 率 建 模 是 否 有 影响 ? 这 个 问题 的 详细 研究 超出 了 本 章 的 
范围 , 这 里 我 们 仅 用 IBM 股票 过 去 的 收益 率 作为 解释 变量 来 说 明 -下 这 个 问题 . 

数据 如 图 3-10 Aras, S&P500 指数 的 月 收益 率 序 列 记 为 re AIR] re 和 高 斯 
GARCH 模型 , 我 们 得 到 如 下 特殊 的 GARCH(2.1) RW 


r,— 0.609--a,, a,— 0€, 02 一 0.717 十 0.147a2 4 4- 0.83902. ,. (3.45) 


均值 方程 中 常数 项 的 标准 误差 为 0.138, 波动 率 方程 中 参数 的 标准 误差 分 别 为 0.214. 
0.021 和 0.017. 基于 标准 化 残 差 a, = aí/o,, RITA Q (10) = 11.51 (0.32), Q (20) = 
23.71 (0.26), 括号 内 为 了 值 . 对 a2, Q (10) = 9.42 (0.49), Q (20) = 13.01 (0.88). 从 而 ， 
在 5% 的 水 平 下 , 模型 是 充分 的 . 

使 用 IBM 股票 作为 S&P500 指数 的 成 分 , 下 面 我 们 评价 其 过 去 的 收益 率 对 
S&P500 指数 波动 率 建 模 的 影响 . 作为 一 个 简单 的 说 明 , 我 们 把 波动 率 方程 修改 为 


a? = ab 十 aaa2 at Bio? 1 -- y (ze — 124), , 
其 中 2, 是 IBM 股票 的 月 对 数 收益 率 , 1.24 是 rt 的 样本 均值 . 对 re 拟 合 的 模型 
变 为 


好 一 0.616 十 ai， t = OtEt, 
o? = 1.069 + 0.148a2 2 + 0.83402. — 0.007 (z;1 — 1.24)”. 


均值 方程 中 参数 估计 的 标准 误差 为 0.139, 波动 率 方程 中 各 参数 估计 的 标准 误差 分 
Hi 0.271. 0.020, 0.018 和 0.002， 关 于 模型 的 检验 , 对 标准 化 残 差 a, = m/t, 
Q (10) = 11.39 (0.33), Q (20) = 23.63 (0.26), 而 对 a?, Q (10) = 9.35 (0.50), Q (20) = 
13.51 (0.85). 因此 , 此 模型 是 充分 的 . 

因为 检验 y= 0 的 p 值 为 0.003 9, 所 以 延迟 间隔 为 1 的 IBM 股票 收益 率 对 
S&P500 指数 波动 率 的 影响 在 1% 的 水 平 下 是 显著 的 . 系数 的 符号 是 负 的 , 这 一 点 
是 可 以 理解 的 . 这 意味 着 延迟 间隔 为 1 的 BM 股票 的 收益 率 能 减 小 S& P500 指数 
波动 率 . 表 3-4 给 出 了 利用 (3.45) 和 (3.46) 式 的 模型 给 从 1999 年 7 月 至 12 月 的 
S&P500 指数 拟 合 的 波动 率 模型 . 从 表 中 可 看 出 , IBM 股票 对 数 收益 率 的 过 去 值 对 
S&P500 指数 波动 率 确实 有 影 啊 . 


(3.46) 


x 3.4 用 带 和 不 带 IBM 过 去 对 数 收益 率 的 模型 拟 合 的 S&P500 指数 从 1999 年 7 月 至 
12 月 的 月 对 数 收 益 率 的 波动 率 


8/99 9/99 10/99 


26.30 26.01 24.73 21.69 20.71 22.46 
23.32 23.13 22.46 20.00 19.45 18.27 


模型 (3.45) 
模型 (3.46) 
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3.15 其 他 方法 


本 节 考 虑 两 种 其 他 的 波动 举 建 模 方 法 . 
3.15.1 ”高 频数 据 的 应 用 


French, Schwert AI Stambaugh(1987) 考虑 了 另 一 种 估计 波动 率 的 方法 . 他 们 用 
高 频数 据 去 计算 低频 收益 率 的 波动 率 . 近年 来 , 这 种 方法 已 经 有 了 一 些 吸 引力 , 因为 
高 频 金融 数据 越 来 越 容 易 获 得 (参见 Andersen, Bollerslev, Diebold 和 Labys(2001a, 
b)). 

假设 我 们 对 某 资产 的 月 波动 率 感 兴趣 , 并 且 我 们 可 以 获得 该 资产 的 日 收益 率 . 
Br? 是 该 资产 的 第 上 个 月 的 月 对 数 收 益 率 . 同时 假设 第 七 个 月 有 n 个 交易 日 , 这 
个 月 中 的 日 对 数 收益 率 为 (0,5) 4. 利用 对 数 收 益 率 的 性 质 , 我 们 有 


r= yi Thi- 
假设 条 件 方差 利 协 方差 存在 , 则 


Var (rz" |Fi-1) = >> Var (rei | Fi) - 23 Cov (reis Tej) i1]. (3.47) 


i=l i<j 


其 中 F 是 第 + 一 1 个 月 已 知 的 信息 . 如 果 添 加 另外 的 假定 , 上 式 可 以 简化 . 例如 ， 
若 假定 {ri} 是 白 噪 声 序列 , 则 


Var (ry |F,.1) = nVar (rei), 
其 中 Var (71,1) 可 以 用 日 收益 率 {reihi 估计 出 来 : 
人 


n-i 
其 中 元 是 第 + 个 月 中 的 日 对 数 收益 率 的 样本 均值 ( 即 元 = ran). 从 而 ,月 
波动 率 的 估计 为 


a2 — 
Cm 一 


z - 1 2. (rui 一元) (3.48) 
3$ {ria} 服从 一 个 MA(1) 模型 , 则 
Var (rm |Fi-1 ) = nVar (r11) 4- 2 (n — 1) Cov (ri, 762) , 


它 的 估计 可 由 下 式 给 出 : 
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. n—1 


n 
as n 2 ^ 7 
62 一 = 1 2 (nia = tha — Ft) (rt i41 一 fi). (3.49) 


n 


上 述 波动 率 估 计 的 方法 很 简单 , 但 在 实际 应 用 中 会 遇 到 一 些 困 难 . 第 一 , 对 日 

收益 率 {rii} 的 模型 是 未 知 的 , 这 就 使 (3.47) 式 中 协 方差 的 估计 复杂 化 了 ， 第 二 ， 
每 个 月 大 约 21 个 交易 日 , 是 个 小 样本 , 这 就 使 (3.47) 式 中 方差 和 协 方差 的 估计 的 
精确 性 值得 怀疑 . 估计 的 精确 性 取决 于 {ri;} 的 动态 结构 和 它 的 分 布 . 若 日 对 数 收 
益 率 有 较 高 的 超额 峰 度 和 较 强 的 序列 相关 性 , 则 (3.48) 和 (3.49) 式 中 的 样本 估计 
02, 甚至 是 不 相合 的 (参见 Bai, Russell 和 Tiao(2004)). 为 了 使 这 种 方法 更 有 实用 
价值 , 还 需要 更 进一步 的 研究 . 
例 3.6 考虑 S&P500 指数 的 对 数 收益 率 的 月 波动 率 , 时 间 是 从 1980 年 1 月 至 
1999 年 12 月 .我 们 用 三 种 方法 来 计算 波动 率 . 第 一 种 方法 , 用 日 对 数 收 益 率 和 
(3.48) 3X ( 即 假定 日 对 数 收益 率 是 白 噪 声 序列 )， 第 二 种 方法 , 用 日 对 数 收益 率 但 假 
定 一 个 MA(1) 模型 ( 即 用 (3.49) 3X). 第 三 种 方法 是 对 1962 年 1 月 至 1999 年 12 
月 的 月 收益 率 拟 合 一 个 GARCH(1, 1) 模型 . 我 们 使 用 更 长 的 时 间 段 是 为 了 得 到 更 
精确 的 月 波动 率 估计 . 所 用 的 GARCH(1, 1) 模型 为 


ry” =0.658+ a, 地 一 otet， of = 3.349 + 0.08627. , + 0.73507_,. 


其 中 e, 是 标准 高 斯 白 噪声 序列 . 图 3-11 所 示 的 是 估计 出 的 月 波动 率 , 我 们 清楚 地 
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图 3-11 S&P500 指数 对 数 收 益 率 的 月 波动 率 估计 值 的 时 间 图 , 时 间 范 围 是 1980 fp 1 月 至 
1999 年 12 H: (a) 假定 日 对 数 收益 率 是 白 噪 声 序列 ; (b) 假设 日 对 数 收 益 率 服从 
MA(1) 模型 ; (c) 利用 从 1962 年 1 月 至 1999 年 12 月 的 月 收益 率 和 GARCH(1,1) 
模型 
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看 到 基于 日 收益 率 的 波动 率 估计 值 要 比 基 于 月 收益 率 和 GARCH(1,1) 模型 的 波动 
率 估计 值 大 许多 . 特别 地 , 当 使 用 日 收益 率 时 , 1987 年 10 月 的 波动 率 估计 值 大 约 
为 680. 而 为 了 三 个 图 有 相同 的 尺度 范围 , 我 们 对 它们 进行 了 截断 . 

在 (3.48) 式 中 , 如 果 我 们 进一步 假定 元 的 样本 均值 是 0, 则 我 们 有 52, = X r2. 


这 时 , 一 个 月 中 日 对 数 收益 率 的 累积 平方 和 就 可 以 作为 月 波动 率 的 估计 . 这 个 概念 
已 经 推广 到 用 某 项 资产 的 交易 日 内 的 对 数 收益 率 来 估计 日 波动 率 . 设 表示 某 项 
资产 的 对 数 收益 率 . 假定 可 以 得 到 等 间隔 的 交易 日 的 对 数 收 益 率 满 足 mr 一 I rea. 
称 量 


Ar, 的 已 实现 波动 率 , 参见 Andersen 等 (2001a, b). 从 数学 上 来 讲 , 已 实现 波动 率 
Fé r 的 二 次 变 差 , 并 且 假 定 (rta 是 均值 为 0, 方差 为 有 限 的 独立 同 分 布 随机 变 
量 序列 . 限定 在 一 定 范围 内 的 经 验 表 明 , In (RV, ) 通常 近似 地 服从 高 斯 ARIMA (0, 1, 
q) 模型 , 该 模型 可 以 用 来 进行 预测 . 更 多 的 信息 参见 11.1 15. 

已 实现 波动 率 的 优点 包括 其 简单 性 以 及 用 到 了 交易 日 内 的 收益 率 . 直观 上 讲 ， 
人 们 喜欢 尽 可 能 地 选择 大 的 n 以 便 用 到 更 多 的 信息 . 然而 , 当 rea 之 间 的 时 间 间 隔 
很 小 时 , 收益 率 将 受到 市 场 微观 结构 的 约束 (例如 买卖 价格 弹性 ), 这 经 常会 导致 波 
动 率 的 有 偏 估计 . 在 构建 已 实现 波动 率 时 如 何 选择 最 优 的 时 间 间 隔 近 来 已 经 吸引 了 
很 多 人 去 研究 . 美国 交易 比较 频繁 的 资产 通常 用 3~15 分 钟 的 时 间 间 隔 . 对 股票 收 
益 率 应 用 已 实现 波动 率 的 另外 一 个 重要 问题 是 如 何 处 理 隔夜 的 收益 率 , 即 从 第 t 一 1 
天 的 收盘 价 到 第 + 天 的 开盘 价 之 间 的 收益 . 忽略 隔夜 收益 率 会 严重 低估 波动 率 . 另 
一 方面 , 一 定 范 围 内 的 经 验 告 诉 我 们 , 对 于 指数 收益 率 和 外 汇 收益 率 而 言 , 隔夜 收 
益 率 很 小 . 

在 一 系列 最 近 的 文章 中 , Barndorff Nielsen 和 Shephard(2004) 已 经 用 资产 的 高 
频 收益 率 来 研究 资产 收益 率 的 双 寡 变化 ,并 提出 了 一 些 方法 来 检测 波动 率 中 的 践 
BR. 


3.15.2 “日 开盘 价 、 最 高 价 、 最 低 价 和 收盘 价 的 应 用 


对 于 许多 资产 ， 日 开盘 价 、 最 高 价 、 最 低 价 和 收盘 价 都 可 以 得 到 Parkin- 
son(1980), Garman 和 Klass(1980), Rogers 和 Satchell(1991) 以 及 Yang 和 Zhang (2000) 
的 研究 表明 可 以 用 这 些 信息 来 改进 对 波动 率 的 估计 . 图 3-12 给 出 了 第 个 交易 日 
价格 对 时 间 的 时 间 图 , 这 里 假定 时 间 是 连续 的 . 对 于 一 项 资产 , 定义 如 下 变量 ; 

e Ci 一 第 上 个 交易 日 的 收盘 价 ; 

e OQ, 二 第 t+ 个 交易 日 的 开盘 价 ; 

。 f= 一 天 内 结束 交易 的 分 数 ; 
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e Hi 二 第 t 个 交易 日 的 最 高 价 ; 
e L,— 第 t 个 交易 日 的 最 低 价 : 
e i 二 第 + 一 1 时刻 所 有 的 已 知 信息 . 


交易 收盘 S5 Th ah 


图 3-12 价格 对 时 间 的 时 间 图 ; 价格 的 规模 是 任意 的 


常规 的 方差 (或 波动 率 ) 是 of = E[(C, 一 Ct_1)?|Fi_1]. Garman 和 Klass(1980) 
考虑 了 of 的 几 种 估计 , 他 们 假定 价格 服从 一 个 不 带 漂移 的 扩散 过 程 (关于 随机 扩 
散 过 程 的 更 多 信息 参见 第 6 章 ). 他 们 考虑 的 估计 包括 : 
5 a3 ym = (C, 一 Ci 1)*; 
(O: — C? (C: — Or)” O;)? 


a2 Paes Sah gl ee J . 
9 01, -— 2f | 2(1— p 0<f <1; 
a _ (He—L 
° 62,= ae = 0.360 7(H, — L)’. 


e 02, = 0.5(H: — Li)? — [21n(2) — 1](C« — O,)?, which is = 0.5(H, — Li)? 
— 0.386(C, — O,)?; 
(Or — Cr-1)* 
f 


e 62, = 0.12 i 


他 们 还 考虑 了 更 精确 但 更 为 复杂 的 估计 3,, 然而 该 估计 与 o2, 很 靠近 . 定义 波动 
率 估计 的 效率 因子 为 


0 cy «1. 


Var(6g, t) 

Eff (a 二 -3 Var(d? D. 
Garman 和 Klass(1980) 发 现 , 对 于 所 考虑 的 简单 扩散 模型 , 当 i = 1, 2, 3, 5, 6 时 ， 
Bf(52,) 分 别 近 似 为 2, 5.2, 6.2, 7.4 和 8.4. 注意 Parkinson(1980) 推导 出 了 f=0 
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时 的 o2 ,. 

定义 如 下 变量 : 

e o = In(O;) — In(Cy_1), 标准 化 开盘 价 ; 

eh = In( H,) = In(O,). 标准 化 最 高 价 ; 

e d, = In(L,) — In(O,), 标准 化 最 低 价 : 

e c, = In(C;) — In(O,), 标准 化 收盘 价 . 
假定 可 以 得 到 天 的 数据 , 并 日 波动 率 在 一 段 时 期 内 为 常数 . Yang 和 Zhang(2000) 
建议 用 下 面 的 估计 作为 波动 率 的 稳健 估计 : 


62, = 62 + ka? + (1 — k)é?,, 


其 中 


1 n 

22 — o— E > 

oa m 3 [ut (ut — Ce) + delde — ct), 
0.34 


-Iutaia 


估计 62, 由 Rogers 和 Satchell(1991) 提出 , 选择 k 使 得 估计 62, 的 方差 最 小 , 其 中 
02. 是 三 种 估计 的 线性 组 合 . 

称 量 A, L 为 第 t 天 价格 变化 的 范围 . 该 估计 导致 了 基于 价格 变化 范围 的 波 
动 率 估计 , 可 参见 , 例如 Alizadeh, Brandt 和 Diebold(2002). 在 实际 中 , 股票 价格 只 
在 离散 时 间 点 上 可 观测 到 . 同样 地 , 观测 到 的 最 高 价格 可 能 比 H, 低 , 而 观测 到 的 
最 低 价格 可 能 比 Le 高 . 因此 , 观测 到 的 日 价格 范围 可 能 会 导致 低估 真实 的 价格 范 
围 , 从 而 可 能 导致 对 波动 率 的 低估 . 波动 率 估 计 中 的 偏差 依赖 于 交易 频率 和 股票 的 
微 尘 记录 间隔 . 对 于 交易 很 密集 的 股票 , 可 以 忽略 偏差 . 对 于 其 他 股票 , 则 需要 进 一 
步 的 研究 来 更 好 地 理解 基于 价格 范围 的 波动 率 估计 的 表现 好 坏 . 


k 


3.16 GARCH 模型 的 峰 度 


波动 率 估 计 中 的 不 确定 性 是 一 个 重要 的 问题 , 但 它 经 常 被 忽视 . 为 了 评估 被 估 
波动 率 的 易 变性 , 人 们 必须 考虑 波动 率 模型 的 峰 度 . 本 节 导 出 了 GARCHI(1,1) 模型 
的 超额 峰 度 , 同样 的 思想 可 应 用 到 其 他 GARCH 模型 中 . 所 考虑 的 模型 为 


2 2 2 
at =0iEt 0; = Qo d- Qa$ ., + BiTi 
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其 中 ao > 0, aa 2 0, 21 > 0,04 +6 <1, {er} 是 独立 同 分 布 序列 , 满足 
Ec, —0, Var(e,)=1, E(ef#) — K.+3, 
其 中 Ke 是 e, 的 超额 峰 度 . 基于 以 上 假设 , 我 们 有 
e Var (a) = E (o7) = ao/ [1 — (o1 + /1)]: 
e E (aj) = (K. - 3) E (of), 只 要 Eo? 是 存在 的 . 
在 波动 率 的 模型 两 边 取 平 方 , 有 


4 2 2,4 924 s 2 , 4 $ 2 
g, — ag + aja, 4, + BIT + 2aga1a4 + 2098107. | + 20,810, 4a, ,. 


再 两 边 取 期 望 并 利用 前 面 所 述 的 性 质 , 我 们 有 
ag (1 十 aa + 51) 


HE 1-014--24,»20H1 — a? (Ke -- 29) — (c1 +r)” > 0. Fi a, 的 超额 峰 度 存在 ， 
则 它 是 


E (e?) = 


_ E(aj) (Ke +3) [1 — (a1 + A 
” Ela)? ^  1-202- (a1 + fi)? — Kea 
此 超额 峰 度 能 写成 一 个 非常 有 启发 性 的 式 子 . 首先 , 考虑 ao, 是正 态 分 布 的 情 
JE. 在 这 个 情形 下 , K- = 0, 并 且 通 过 简单 的 代数 运算 可 得 
6a? 
1 — 2a? — (ay + i)?" 


其 中 上 和 角 标 (9) 用 米 表示 高 斯 分 布 . 这 个 结果 有 两 个 重要 推论 : (a) d$ 1 — 20? 一 
(a, +81)? > 0, W 的 峰 度 存在 ; (b) 车 o, = 0, W KP = 0, 意味 着 对 应 的 
GARCH(1,1) 模型 没有 厚 尾 . 

其 次 , 考虑 e, 不 是 高 斯 分 布 的 情形 . 利用 前 面 的 结果 , 我 们 有 


K. — Ke (a1 + 01) + 6a? +38K a7 
1 — 2a? — (o 4- fh)? — Ko? 


Ki» ES 


Ka = 
Ke E —2a$ — (a1 y | + 6ai--5K.ai K.+ KE? 十 P KIC 
(——— d-*ab-(m A) Ra O — 1-i1KK 
这 个 结果 最 初 由 George C.Tiao 得 到 (参见 Bai, Russell 和 Tiao(2003)), 它 对 所 有 
存在 峰 度 的 GARCH 模型 成 立 . 例如 , 当 3, = o 时 , 模型 退化 为 ARCII(1) 模型 , 这 
时 只 要 3a1 <1, W KO = 6a3/ (1 一 3a3), 并 且 ar 的 超额 峰 度 为 
_ (Ke 4-3) (1— o1) x K.+2K.a?2 + 6a? 


kK, = a Cael. os 
1 — (K: +3) o1 i 1 — 3a? — K-a? 
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_ K.(1-3ei)-6oi--5K.o] Ke+ Kf? + BKeKe) 


1 — 3a? — K-03 1K Ko 
上 述 结 果 表 明 : 对 GARCH(1,1) 模型 来 说 , 系数 a, 在 决定 a, 的 尾部 行为 时 
起 关键 作用 . # m =0, W KM =0 H Ka = K.. 这 时 a, 的 尾部 行为 与 标准 化 品 
声 e, 的 尾部 行为 相似 . 车 mm > 0, 则 KY > 0, a, 过 程 有 厚 尾 性 . 
对 一 个 (标准 化 的 ) 自由 度 为 v 的 学 生 - 分布 , 车 v > A, 我 们 有 E (et) = 
6/ (v —4) +3. 因此 , Mo > 4, st 的 超额 峰 度 为 K- = 6/ (v — 4). 这 就 是 本 章 中 当 学 
生 -t 分 布 的 自由 度 事 先 给 定时 我 们 使 用 ts 的 部 分 原因 . HE 1—2a? (v—1) / (v—4)— 
(o1 + 81)? > 0, 则 a, 的 超额 峰 度 变 为 Ka — [6 t (v4- 1) Ke” / [v oF ki]. 
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在 实例 说 明 过 程 中 所 用 的 数据 文件 是 “sp500.txt"”, 该 文件 中 包含 的 是 S&P500 
指数 的 超额 收益 率 , JE 792 个 观察 值 . RATS 程序 中 的 注释 前 面 带 * 号 . 


A 带 常 数 均 值 方程 的 高 斯 GARCH(1,1) 模型 


all 0 792:1 

open data sp500.txt 

data(org-obs) / rt 

*** initialize the conditional variance function 
set h = 0.0 

*** gpecify the parameters of the model 

nonlin mu a0 al b1 

*** specify the mean equation 

frml at = rt(t)-mu 

*** specify the volatility equation 

frml gvar = a0+al*at (t-1) **2+b1*h(t-1) 

*** specify the log likelihood function 

frml garchln = -0.5*log(h(t)=qvar(t))-0.5*at(t) **2/h(t) 
*** sample period used in estimation 

smpl 2 792 

*** initial estimates 

compute a0 = 0.01, al = 0.1, bl = 0.5, m = 0.1 
maximize (method=bhhh, recursive, iterations=150) garchln 
set fv = gvar(t) 

set resid = at(t)/sqrt(fv(t)) 

set residsq = resid(t)*resid(t) 

*** Checking standardized residuals 

cor (qstats,number=20,span-10) resid 

*** Checking squared standardized residuals 

cor (qstats,number=20,span=10) residsq 


B 带 学 生 -t 分 布 新 息 的 GARCH(1,) 模型 


all 0 792:1 
open data sp500.txt 
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data(org-obs) / rt 

set h = 0.0 

nonlin mu a0 al bl v 

frml at - rt(t)-mu 

frml gvar = a0+al*at(t-1) **2+bi*h(t-1) 

frml tt = at(t)**2/ (h(t) =gvar(t) ) 

frml tln = $LNGAMMA((v«1)/2.)-*LNGAMMA(v/2.) -0.5*1og(v-2.) 
frml gln = tln-((v+1)/2.)*1log(1.04+tt(t) /(v-2.0))-0.5*log(h(t) ) 
empl 2 792 

compute a0 = 0.01, ai = 0.1, bl = 0.5, mu = 0.1, v = 10 
maximize (method=bhhh, recursive, iterations=150) gln 

set fv = gvar(t) 

set resid = at(t)/sqrt(fv(t)) 

set residsq = resid(t) *resid(t) 

cor (qstats,number=20,span=10) resid 

cor (qstats,number=20,span=10) residsq 


C 对 IBM 股票 月 对 数 收益 率 的 AR(1)-EGARCH(I, 1) 模型 


all 0 864:1 

open data m-ibm.txt 

data(org-obs) / rt 

set h = 0.0 

nonlin c0 pi th ga a0 al 

frml at = rt(t)-cO pl*rt(t-1) 

frml epsi - at(t)/(sqrt(exp(h(t)))) 

frml g = th*epsi (t) +ga* (abs (epsi (t) )-sqrt(2./%PI) ) 
frml gvar = al*h(t-1)+(1-al) *a0+g(t-1) 

frml garchln = -0.5*(h(t)-gvar(t))-0.5*epsi (t) **2 
smpl 3 864 

compute c0 = 0.01, pl = 0.01, th = 0.1, ga = 0.1 
compute a0 = 0.01, al = 0.5 

maximize (method=bhhh, recursive, iterations=150) garchln 
set fv = gvar(t) 

set resid = epsi(t) 

set residsq = resid(t) *resid(t) 

cor (qstats,number=20,span=10) resid 

cor (qstats,number=20,span=10) residsq 
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3.1 对 GARCH(1,2) 模型 , 导出 以 h 为 预测 原点 的 向 前 多 步 预 测 公 式 . 

3.2 对 GARCH(2,1) 模型 , 导出 以 h 为 预测 原点 的 向 前 多 步 预 测 公 式 . 

3.3 BE ri, ,rw 是 来 自 于 服从 如 下 AR(1)-GARCH(1,1) 模型 的 收益 率 序列 的 观察 值 : n. = 
+ Ores + at, Ot = ore, of = ao d 0107 4 + P107 ,, 其 中 et 是 标准 的 高 斯 白 噪 声 . 
导出 这 组 数据 的 条 件 对 数 似 然 函 数 ， 

3.4 在 上 题 中 , 假定 ce 服从 自由 度 为 v 的 标准 化 的 学 生 -t 分 布 . 导出 数据 的 条 件 对 数 似 然 函 
a. 

3.5 考虑 Intel 股票 从 1973 年 至 2003 年 的 月 简单 收益 率 , 数据 包含 在 文件 m-intc7303. txt" 
中 . 将 收益 率 转换 为 对 数 收益 率 . 对 转换 后 的 序列 建立 一 个 GARCH 模型 并 计算 以 2003 


3.6 


3.7 


3.8 


3.9 
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年 12 月 为 预测 原点 的 向 前 1 步 至 5 步 的 波动 率 预 测 值 . 

文件 "m-mrk.dat" 包含 了 Merck 股票 从 1946 年 6 月 到 2003 年 12 月 的 月 简单 收益 率 ， 

有 两 列 : 日 期 和 月 简单 收益 率 . 把 简单 收益 率 变换 成 对 数 收 益 率 . 

(a) 对 数 收益 率 中 有 没有 明显 的 序列 相关 性 ? 用 自 相 关系 数 和 5 名 的 显著 性 水 平 来 回答 该 
问题 . 如 果 有 , 则 移 除 序列 相关 性 . 

(b) 此 对 数 收 益 率 存在 ARCH 效应 吗 ? 如 果 (a) 部 分 中 有 序列 相关 性 , 则 该 部 分 用 其 残 
差 序列 . 用 Ljung-Box 统计 量 , 对 收益 率 平方 (或 残 差 的 平方 ) 的 6 个 间隔 和 12 个 
间隔 的 白 相 关系 数 , 在 5% 的 显著 水 平 下 回答 该 问题 . 

(c) 对 数据 识别 一 个 ARCH 模型 , 然后 给 数据 拟 合 被 识别 的 模型 , 写 出 所 拟 合 的 模型 . 

文件 "m-3m4603.txt" 包括 两 列 , 分 别 是 3M 公司 股票 的 日 期 和 月 简单 收益 率 . 把 收益 率 

变换 成 对 数 收益 率 . 

(a) 对 数 收益 率 存 在 ARCH 效应 吗 ? 用 6 个 间隔 和 12 个 间隔 的 自 相关 系数 所 构成 的 
Ljung-Box 统计 量 , 在 596 的 显著 水 平 下 回答 该 问题 . 

(b) 用 收益 率 平方 的 PACF 识别 一 个 ARCH 模型 . 所 拟 合 的 模型 是 什么 ? 

(c) 共有 695 个 数据 点 . 利用 前 690 个 观测 重新 拟 合 模 型 , 并 利用 所 拟 合 的 模型 来 预测 
t= 691 到 t = 695 时 的 波动 率 (预测 原点 为 h = 690). 

(d) 对 3M 股票 的 对 数 收益 率 建立 一 个 ARCH-M 模型 . 在 5965 的 显著 水 平 下 检验 风险 
BETA 0 的 假设 , 得 出 你 的 结论 . 

(e) 利用 前 690 个 观测 对 3M 股票 的 对 数 收益 率 建立 一 个 EGARCH 模型 . 利用 所 建 模 
型 计算 以 及 = 690 为 预测 原点 的 向 前 1 By Bip o 步 的 波动 率 预测 ， 

文件 “m-gmsp5003.txt” 包含 日 期 以 及 General Motors 股票 和 S&P500 指数 从 1950 年 

至 1999 年 的 月 对 数 收益 率 ， 

(a) 给 GM 股票 对 数 收益 率 建立 一 个 带 高 斯 新 息 的 GARCH 模型. 检验 模型 并 写 出 最 后 
所 拟 合 的 模型 . 

(b) 给 GM 股票 的 对 数 收益 率 建 立 一 个 带 高 斯 新 息 的 GARCH-M 模型 ， 所 拟 合 的 模型 
是 什么 ? 

(c) 给 GM 股票 的 对 数 收益 率 建立 一 个 带 学 生 -t 分 布 新 息 的 GARCH 模型 , 估计 出 自 
由 度 并 写 出 最 后 拟 合 的 模型 . 设 v 是 学 生 -t 分 布 的 自由 度 , 在 596 的 显著 水 平 下 检 
验 假设 Ho :v= 二 6 对 H,:vz6. 

(d) 给 GM 股票 的 对 数 收益 率 建立 一 个 EGARCH 模型 . 所 拟 合 的 模型 是 什么 ? 

(e) 利用 对 GM 股票 的 对 数 收 益 率 所 拟 合 的 所 有 波动 率 模型 进行 向 前 1 步 到 向 前 6 步 预 
测 , 并 进行 比较 . 

青 考虑 文件 “m-gmsp5003. txt” "HIY GM 股票 . 为 序列 建立 一 个 充分 的 TGARCH BUS. 

写 出 所 拟 合 的 模型 并 进行 杠杆 效应 的 显著 性 检验 , 给 出 向 前 1 步 到 向 前 6 步 预测 . 

再 次 考虑 文件 “m-gmsp5003.txt” 中 的 收益 率 . 

(a) 对 S&P500 指数 的 月 对 数 收 益 率 建立 一 个 高 斯 GARCH 模型 . 仔细 检验 模型 . 

(b) 在 该 指数 收益 率 的 波动 率 中 存在 夏季 效应 吗 ? 利用 上 小 题 中 所 建立 的 GARCH 模型 
来 回答 . 

(c) GM 股票 的 延迟 收益 率 在 该 指数 波动 率 建 模 中 有 用 吗 ? 利 用 本 题 中 (a) 所 建 的 GARCH 
模型 作为 基础 模型 来 比较 . 
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3.11 文件 “d-gmsp9303.txt” 包 含 了 GM 股票 和 S&P500 复合 指数 从 1993 到 2003 的 日 简 
单 收益 率 , 有 三 列 , 分 别 是 日 期 GM 股票 收益 率 和 SP 收益 率 . 
(a) 计算 GM 股票 的 日 对 数 收益 率 . 对 数 收益 率 中 存在 ARCH 效应 吗 ? 你 可 以 用 平方 收 
益 率 的 10 个 延迟 值 和 5% 的 显著 性 水 平 进行 检 验 . 
(b) 计算 平方 收益 率 序列 的 PACEF(10 个 间隔 以 内 的 ). 
(c) 给 GM 对 数 收 益 率 拟 合 一 个 高 斯 GARCH 模型 . 进行 检验 , 并 写 出 所 拟 合 的 模型 . 
(d) 给 序列 建立 一 个 带 广义 误差 分 布 新 息 的 GARCH 模型, 写 出 所 拟 合 的 模型 . 
3.12 考虑 文件 "a-gmsp9303.tzt" 中 的 S&P500 复合 指数 的 日 简单 收益 率 . 
(a) 该 简单 收益 率 中 存在 ARCH 效应 吗 ? 你 可 以 用 平方 收益 率 的 10 个 延迟 值 和 59685 
显著 性 水 平 进行 检验 . 
(b) 为 简单 收益 率 序列 建立 一 个 充分 的 GARCH 模型 . 
(c) 根据 所 拟 合 的 模型 计算 简单 收益 率 序列 及 其 波动 率 的 向 前 1 步 到 向 前 4 步 预测 . 
3.13 再 次 考虑 文件 “d-gmsp9303.txt” 中 GM 股票 的 日 简单 收益 率 . 
(a) 为 序列 拟 合 一 个 充分 的 GARCH-M 模型 , 并 写 出 该 模型 . 
(b) 为 序列 拟 合 一 个 充分 的 EGARCH 模型 . 杠杆 效应 在 5% 的 显著 性 水 平 下 显著 吗 ? 
3.14 再 次 访问 文件 “d-gmsp9303. txt”. 然而 , 我 们 将 研究 市 场 波动 率 在 单个 股票 波动 率 建 模 
中 的 意义 . 将 这 两 个 收益 率 转换 为 对 数 收 益 率 , 并 以 百分比 形式 给 出 . 
(a) 为 对 数 S&P500 收益 率 建立 一 个 带 广义 误差 分 布 的 AR(5)-GARCH(1,1) 模型 . AR(5) 
模型 中 只 包含 延迟 为 3 和 5 的 值 . Al "spvol" 表示 所 拟 合 的 波动 率 序 列 . 
(b) 把 “spvol” 作 为 外 生变 量 为 对 数 GM 收益 率 序列 建立 一 个 GARCH(1, 1) 模型 . f£ 
验 模型 的 充分 性 , 并 写 出 所 拟 合 的 模型 . 在 S-Plus 中 , 命令 为 
fit = garch(gm~1, ~garch(1,1)+spvol, cond.dist=‘ged’) 
(c) 讨论 所 拟 合 模型 的 意义 . 
3.15 仍 像 以 前 那样 考虑 GM 股票 和 S&P500 指数 从 1993 年 到 2003 年 的 日 对 数 收 益 率 的 百 
分 比 . 但 我 们 研究 GM 股票 的 波动 率 对 S&P500 指数 波动 率 的 建 模 有 没有 贡献 . 采取 以 
下 步骤 进行 分 析 : 
(a) 给 GM 股票 对 数 收益 率 的 百分比 拟 合 一 个 带 广义 误差 分 布 的 GARCH(I, 1) 模型 . 
拟 合 的 波动 率 用 “gmvol” 表示. 将 “gmvol” 作 为 外 生变 量 为 S&P500 指数 的 对 数 收 
益 率 拟 合 一 个 充分 的 GARCH 模型 . 将 所 拟 合 的 模型 写 出 来 . 
(b) 在 为 S&P500 指数 收益 率 波动 率 的 建 模 中 , GM 股票 收益 率 的 波动 率 有 用 吗 ? 为 什 
A? 
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第 4 章 非 线性 模型 及 其 应 用 


木 章 主要 讨论 金融 数据 中 的 非 线 性 问题 和 金融 时 间 序 列 分 析 中 有 用 的 非 线 性 
经 济 计量 模型 . 考虑 一 元 时 间 序 列 zt*, 为 简单 起 见 , 假定 观察 的 时 间 间 隔 是 等 距 的 . 
id {zzlt = 1,--- ,了 T} 为 观察 值 , 7 是 样本 容量 . 如 第 2 章 中 所 述 , 一 个 纯 随 机 的 时 间 
序列 称 为 线性 的 , 如 果 它 能 表示 成 


oo 
— u$, Via, (4.1) 
i=0 


其 中 u ERR, wy — 1, v; 是 实数 , (au) 是 独立 同 分 布 的 随机 变量 序列 , 它们 共同 
的 分 布 函数 是 合理 定义 的 . 假定 a. 的 分 布 是 连续 的 且 E(a,) = 0. 在 许多 场合 下 ， 
我 们 进一步 假定 Var(at) = c2, 更 进一步 地 , a, 是 高 斯 的 . 若 o? P V? < oo, 则 z, 


是 弱 平 稳 的 (也 即 v, 的 前 两 阶 矩 不 随时 间 变 化 ). 第 2 章 中 ARMA 过 程 是 线性 的 ， 
因为 它 有 形 如 (4.1) 式 的 MA 表示 . 任何 不 能 表示 成 (4.1) 式 的 随机 过 程 称 为 是 非 
线性 的 . 这 个 非 线 性 的 定义 是 针对 纯 随机 的 时 间 序 列 ， 人 们 可 以 拓展 这 个 定义 , 允 
VF zt 的 均值 是 一 些 外 生变 量 的 线性 函数 , 这 些 外 生变 量 包括 时 间 指 标 和 某 些 周期 
函数 . 但 这 样 的 均值 函数 很 容易 用 第 2 章 中 介绍 的 方法 来 处 理 , 我 们 在 此 不 作 讨论 . 
从 数学 上 讲 , ce 的 “个 纯 随机 时 间 序 列 模型 是 由 现在 和 过 去 的 “扰动 ”所 构成 的 独 
立 同 分 布 序 列 的 一 个 函数 : 

ZL = f(at,Qt-1,.**). (4.2) 


当 f(.) 是 其 自 变量 的 线性 函数 时 , 则 m, 就 是 (4.1) 式 中 的 线性 模型 . f(.) 中 的 任何 
非 线 性 性 都 会 导致 一 个 非 线 性 模型 . 不 能 直接 应 用 一 般 的 非 线性 模型 (4.2), 因为 它 
包含 了 太 多 的 参数 . 

为 了 把 文献 中 可 见 到 的 非 线 性 模型 放 在 一 个 合适 的 框架 中 , 我 们 把 c 的 模型 
写成 它 的 条 件 窍 的 形式 . WE F- 是 由 1 一 1 时 刻 已 有 信息 产生 的 o- 域 . 典型 的 Fy- 1 
是 由 (2151,71 2,77) 和 {ar a2) 中 的 元 素 线性 组 合 而 成 的 . 给 定 Fi 2 
的 条 件 均值 和 条 件 方差 分 别 是 


pi = E(ai|Fi-1) =9(Fi-1), 0? = Var(zi|Fi-i) = h(Fi-1), (4.3) 
其 中 g(.) 和 AC) 是 有 意义 的 函数 , C) > 0. 这 样 , 我 们 把 模型 限制 为 
Tt = g(Fi-1) + V h(Fi-i)er, 
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其 中 e, = a/o, 是 标准 化 的 “扰动 "(或 新 息 ). 对 (4.1) 式 中 的 线性 序列 ay, g(.) 是 
Fi 中 元 素 的 线性 函数 , hi) = o2. 

非 线性 模型 的 发 展 就 在 于 (4.3) 式 中 的 两 个 方程 的 扩展 . 若 g(.) 是 非 线性 的 ， 
则 z, 称 为 是 均值 非 线性 的 ; 若 h(.) 是 时 变 的 , 则 c, 是 方差 非 线 性 的 . 第 3 章 的 条 
件 异 方差 模型 都 是 方差 非 线 性 的 , 因为 它们 的 条 件 方差 随时 间 变 化 . 事实 上 , 除了 
GARCH-M 模型 中 u 依赖 于 o2, 从 而 随时 间 变 化 外 , 第 3 章 中 所 有 其 他 的 波动 率 
模型 都 着 眼 于 (4.3) 式 中 条 件 方差 方程 的 扩展 或 修改 . 基于 熟知 的 Wold 分 解 , 一 个 
弱 平 稳 的 、 纯 随 机 的 时 间 序 列 能 表示 成 不 相关 的 “扰动 ”的 一 个 线性 函数 . 对 于 平 
稳 波 动 率 序列 , “扰动 ” 互 不 相关 , 但 不 独立 . 木 章 讨 论 的 模型 是 另 一 种 向 非 线 性 的 
扩展 , 这 种 非 线性 性 由 对 (4.3) 式 中 的 条 件 均 值 方程 的 改动 或 扩展 引起 . 

统计 学 文献 中 已 提出 了 许多 非 线性 时 间 序 列 模型 ， 如 Granger 和 Andersen 
(1978) 的 双 线 性 模型 (bilinear model), Toug (1978) 的 门限 自 回归 (threshold autore- 
gressive, TAR) 模型 , Priestley (1980) 的 状态 相依 (state-dependant) 模型 和 Hamil- 
ton (1989) 的 马尔 可 夫 转 移 (Markov switching) 模型 . 这 些 非 线性 模型 的 基本 思想 
都 是 让 条 件 均值 函数 uu 按 简 单 的 参数 非 线 性 函数 随时 间 演 变 . 近 米 , 利用 计算 设备 
和 计算 方法 上 的 进展 , 人 们 提出 了 一 些 新 的 非 线 性 模型 . 这 些 扩展 模型 包括 Carlin, 
Polson 和 Stoffer (1992) 的 非 线 性 状态 空间 建 模 , Chen 和 Tsay (1993a) 的 泛 函 系数 
自 回 归 模 型 , Chen 和 Tsay (1993b) 的 非 线性 可 加 自 回归 模型 以 及 Lewis 和 Stevens 
(1991) 的 多 元 适应 回归 样 条 . 这 些 扩展 的 基本 思想 或 者 用 模拟 方法 来 描述 zt 条 件 
分 布 的 演变 或 者 用 数据 驱动 (data-driven) 方法 来 探索 一 个 序列 的 非 线 性 特征 . 最 
ja, 非 参 数 和 半 参 数 方 法 , 如 核 回归 和 人 工 神 经 网 络 , 已 经 被 用 来 探索 时 间 序 列 中 
的 非 线 性 性 . 4.1 节 将 讨论 一 些 可 应 用 到 金融 时 间 序 列 分 析 上 的 非 线 性 模型 , 包括 
一 些 非 参数 和 半 参 数 方 法 . 

除了 各 种 非 线 性 模型 的 发 展 , 人们 还 对 能 区 分 线性 序列 和 非 线 性 序列 的 检验 统 
计量 的 研究 感 兴趣 . 现在 可 用 的 检验 方法 中 既 有 参数 检验 又 有 非 参 数 检 验 . 大 多 数 
参数 检验 是 利用 拉 格 朗 日 乘 子 法 或 似 然 比 统计 量 . 非 参数 检验 依赖 于 x 的 高 阶 谱 
或 依赖 于 针对 混沌 时 间 序 列 发 展 起 来 的 维 数 相关 系数 , 4.2 节 将 介绍 一 些 非 线性 检 
验方 法 ; 4.3 节 和 4.4 节 讨 论 非 线性 模型 的 建 模 与 预测 ; 最 后 , 4.5 节 给 出 了 非 线性 
模型 的 应 用 . 


4.1 ” 非 线 性 模型 


统计 文献 中 发 展 起 来 的 大 多 数 非 线性 模型 都 是 针对 (4.3) 式 中 的 均值 方程 的 ， 
具体 可 参见 Priestley (1988) 和 Tong (1990) 中 关于 非 线性 模型 的 综述 . 这 里 , 我 们 
的 目的 是 介绍 一 些 能 用 到 金融 时 间 序 列 上 的 非 线性 模型 . 
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4.1.1 ” 双 线 性 模型 


(4.1) 式 的 线性 模型 只 是 (4.2) 式 的 函数 f(.) 的 一 阶 Taylor JF. 这 样 , 向 非 
线性 扩展 的 一 个 自然 的 推广 就 是 使 用 这 个 展开 的 二 阶 项 来 改进 逼近 . 这 就 是 双 线 性 
模型 的 基本 想法 . 双 线 性 模型 可 以 定义 为 


p q m s 

Zt—c P itii — > Ojat- + v >| Piywe -tat + at, (4.4) 
其 中 p,g,m 和 s 是 非 负 整 数 . 这 个 模型 由 Granger 和 Andersen (1978) 提出 , 并 得 
到 了 广泛 研究 . Subba Rao 和 Gabr (1984) 讨论 了 这 个 模型 的 一 些 性 质 和 应 用 ,Liu 
和 Brockwell (1988) 研究 了 一 般 的 双 线 性 模型 , 双 线 性 模型 的 性 质 (如 平稳 性 条 件 ) 
通常 通过 两 个 步骤 导出 : (a) 把 模型 写成 状态 空间 形式 ; (b) 利用 状态 转移 方程 把 状 
态 表示 成 过 去 的 新 息 与 随机 系数 向 量 的 乘积 . (4.4) 式 中 的 双 线 性 模型 的 特殊 推广 
形式 是 有 条 件 异 方差 性 的 . 例如 , 考虑 模型 


s 
r= pd 》 biia Fiai (4.5) 


i=1 


其 中 {a} 是 一 个 白 噪声 序列 . c ATP RE 


E(z|Fi-1) — p, Var(zt| 玉 -1) = ( + Fha) c2, 
ixl 

这 与 第 3 章 中 的 随机 系数 自 回 归 (RCA) 模型 或 条 件 异 方差 ARMA (CHARMA) 模 
28 (5 RÜ V3 fF FAB ALA. 

例 4.1 考虑 CRSP 等 权重 指数 从 1926 年 1 月 至 1997 年 12 月 的 月 简单 收益 率 ， 
FE 864 个 观察 值 . 记 此 序列 为 Ri. Re 的 样本 偏 自 相关 函数 (PACF) 在 间隔 为 1 和 
3 处 是 显著 的 , 而 R? 的 样本 PACF 显示 条 件 异 方差 可 能 依赖 于 过 去 的 三 个 新 息 . 
因此 , 我 们 对 此 序列 采用 特殊 的 双 线 性 模型 : 


Ri = p+ Fa + $3F 3 + (1 + Brar—1 + B2at—2 + Paar 3)ar. 
假定 a, 的 条 件 分 布 为 正 态 分 布 , 我 们 用 条 件 最 大 似 然 法 得 到 所 拟 合 的 模型 
HR, = 0.0144-0.160R, 1 — 0.104 R, .3-- (14-0.337a,.. —0.022a, 3 —0.601a,. 3)a;, (4.6) 


其 中 62 = 0.005 2, 各 参数 估计 的 标准 差 依 次 分 别 为 0.003, 0.026, 0.018, 0.083, 0.084 
和 0.079. 只 有 ao 的 系数 的 估计 值 是 不 显著 的 . 定义 此 模型 的 残 差 序列 为 


H4 — 0.014 — 0.160 R, 1 十 0.014 忆 3 


"= 12-0.3370, 3 — 0.022; :3 — 0.8015, 5" 
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其 中 , 对 t < 3,4, = 0. à, 的 样本 ACF 显示 没有 显著 的 序列 相关 性 , 但 a, 不 是 独 
立 的 序列 , 因为 平方 序列 好 有 显著 的 序列 相关 性 , 模型 (4.6) 的 有 效 性 需要 进一步 
研究 , 为 了 作 比 较 , 我 们 再 对 此 月 简单 收益 率 序列 考虑 一 个 ARCH(3) 模型 , 得 到 


Ri = 0.013 + 0.222Ri_1 — 0.140Ry~3 + at, 
a? = 0.002 + 0.168a?_, + 0.000 Olaf + 0.27482 4, 


其 中 除 a?_, 的 系数 外 , 其 他 所 有 估计 值 都 是 高 度 显 著 的 . 标准 化 的 残 差 序列 和 它 
的 平方 序列 都 没有 显著 的 序列 相关 性 , 这 表示 所 建 的 ARCH(3) 模型 对 数据 是 充分 
的 . 模型 (4.6) 和 (4.7) 有 些 相似 , 但 后 者 似乎 能 更 好 地 拟 合 数据 . 


4.1.2 ”门限 自 回 归 模 型 


此 模型 出 现 的 动因 是 实际 中 经 常 观察 到 的 几 种 非 线性 特征 , 例如 一 个 过 程 在 上 
升 和 下 降 阶 段 的 非 对 称 性 . 它 用 分 段 线性 模型 来 得 到 条 件 均值 更 好 的 逼近 . 然而 ， 
与 传统 的 分 段 线性 模型 不 同 的 是 : 传统 的 模型 允许 模型 的 变化 发 生 在 时 间 空 间 上 ， 
而 TAR 模型 则 利用 门限 空间 来 改进 线性 逼近 . 我 们 从 简单 的 两 体制 AR(1) 模型 开 
始 


(4.7) 


| —15a,-1:+a:, 4 m1 <0, (4.8) 


0.5:4—1 + Gt, 若 zi-1 2 0, 
其 中 a, 独立 同 分 布 服从 于 IN (0, 1). 这 里 , 门限 变量 为 ri, 延迟 是 1, 门限 是 0. 
4-1 所 示 的 是 zt 的 200 个 模拟 观察 值 的 时 间 图 . 图 中 加 入 的 一 条 恒 为 0 的 水 平 线 ， 
这 反映 出 TAR 模型 的 几 个 特征 . 第 一 , 尽管 在 第 一 个 体制 中 的 系数 是 一 1.5, 过 程 
还 是 几何 遍历 (geometrically ergodic) 和 平稳 的 . 事实 上 , 模型 (4.8) 是 几何 遍历 的 
充 要 条 件 是 o) <1, 0)? <1 A oP OP) « 1, ep of? 是 体制 i 的 AR AM, TS 
KL Petruccelli 和 Woolford (1984), Chen 和 Tsay (1991). 遍历 性 在 时 间 序 列 分 析 中 

T 

是 一 个 重要 的 概念 . 例如 , 证 明 样 本 均值 z= Y zt/T 收敛 于 m 的 均值 的 统计 理 


论 称 为 遍历 定理 (ergodic theorem). 它 被 认为 是 与 独立 同 分 布 情形 的 中 心 极限 定理 
同等 重要 的 理论 . 第 一 , 该 序列 显示 出 非 对 称 的 上 升 和 下 降 态势 : 车 2, 是 负 的 ， 
则 zx, 将 转向 一 个 正 值 , 因为 这 时 有 人 负 的 膨胀 系数 —1.5; 然而 , 车 xz._1 是 正 的 , 则 
经 过 几 个 时 间 指 标 后 序列 变 为 负 值 . 从 而 , a, 的 时 间 图 显示 出 体制 2 比 体 制 1 有 更 
多 的 观察 值 , 并 且 当 序列 取 负 值 时 它 包 含有 很 大 的 向 上 跳跃 . 因此 , 此 序列 不 是 时 
间 可 逆 的 (time-reversible). P=, 此 模型 没有 常数 项 , 但 E(x.) BAO. 图 中 所 示 的 
这 个 具体 实现 的 样本 均值 是 0.61, 标准 差 为 0.07. 一 般 地 , Elz) 是 两 个 体制 下 的 条 
件 均 值 的 加 权 平 均 , 通常 不 是 0, 而 每 个 体制 的 权重 就 是 在 平稳 分 布下 m, 处 于 该 体 
市 的 概率 . 要 使 TAR 模型 的 均值 为 0, 需要 在 有 的 体制 中 有 非 零 常数 项 . 这 一 点 与 
平稳 线性 模型 有 很 大 不 同 . 在 平稳 线性 模型 中 非 零 常数 项 的 存在 意味 着 zt 的 均值 
RAS. 
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0 50 100 150 200 


时 间 指 数 
图 4-1 模拟 的 两 个 体制 TAR(1) 序列 的 时 间 图 


称 一 个 时 间 序 列 c, 服从 门限 为 sea 的 天 个 体制 的 自 激 发 (self-exciting)TAR 
(SETAR) 模型 , 如 果 它 满足 


a = d$ +P ti — +++ — o zy 4 ap, H j-i < mea BY, (4.9) 


其 中 k Al d 是 正 整数 , j — 1,… ,kk. 3; 是 满足 —00 = 90 < m € « m1 € = 
oo 的 实数 , 上 角 标 (7) 用 来 表示 体制 , (a) ESEA 0. FEW o? 的 独立 同 分 布 序 
列 , 且 对 不 同 的 7 是 相互 独立 的 . 参数 d 称 为 延迟 参数 , 称 为 门限 . 这 里 , 对 不 同 
的 体制 , AR 模型 是 不 同 的 , 否则 可 减少 体制 的 个 数 . (4.9) 式 的 自 激 发 TAR 模型 是 
在 门限 空间 中 的 分 段 线性 AR 模型. 它 与 回归 分 析 中 通常 的 分 段 线性 模型 的 思想 
相似 , 只 是 那里 模型 的 变化 是 以 取得 观察 值 的 时 间 为 顺序 的 . 只 要 上 > 1, SETAR 
模型 就 是 非 线 性 的 . 

一 般 的 SETAR 的 性 质 难以 得 到 ,一 些 特殊 情形 的 性 质 可 以 在 Tong (1990), 
Chan (1993), Chan 和 Tsay (1998) 以 及 这 几 个 文献 的 参考 文献 中 看 到 .近年 来 ， 
人 们 对 TAR 模型 和 它们 的 应 用 越 来 越 感 兴趣 , 具体 可 参见 Hansen (1997), Tsay 
(1998) 和 Montgomery % (1998). Tsay (1989) 提出 了 一 个 对 一 元 SETAR 检验 和 
建 模 的 方法 . (4.9) RM SETAR 模型 可 以 推广 , 只 需要 利用 关于 Fa 可 测 的 门限 
变量 z, (也 即 , 它 是 Fo. 中 元 素 的 函数 )， 这 里 主要 要 求 z, 是 平稳 的 , 有 在 实 直线 
的 紧 子 集 上 连续 的 分 布 函数 , FFA zs TE t 时 刻 是 已 知 的 . 这 样 的 推广 模型 称 为 
开 环 (open-loop) TAR 模型 . 

例 4.2 为 了 说 明 TAR 模型 的 应 用 , 考虑 美国 从 1948 年 1 月 到 2004 年 3 月 的 
月 平民 失业 率 , 共有 675 个 观测 , 数据 已 经 经 过 季节 调整 并 且 以 百分比 的 形式 给 出 . 
数据 来 自 劳工 部 劳动 统计 局 , 图 4-2 给 出 了 数据 的 时 间 图 . 该 图 显示 出 数据 的 两 个 
主要 特征 . 第 一 , 总 的 来 看 失业 率 有 一 个 缓慢 上 升 的 趋势 ; 第 二 , 失业 率 波动 较 大 ， 
倾向 于 迅速 上 升 , 然后 迅速 下 降 ， 因 此 , 该 序列 不 是 时 间 道 转 的 , 也 不 是 单位 根 平 
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稳 的 . 


1950 19%60 1970 1980 1990 2000 
年 
图 4-2 从 1948 年 1 月 到 2004 年 3 月 的 美国 月 失业 率 的 时 间 图 , 数据 已 经 经 过 季节 调整 


由 于 样本 自 相关 函数 衰减 缓慢 , 所 以 在 分 析 中 我 们 使 用 月 失业 率 序列 u 的 一 
阶 差分 序列 y, = (1 Bju. 我 们 得 到 如 下 的 一 元 ARIMA 模型 


(1—1.18B+0.33B°)(1 — 0.518'?)y, = (1 — 1.17B + 0.48B?)(1 — 0.82B'?)a,, (4.10) 


其 中 ôa = 0.190, 所 有 的 系数 在 5 名 的 水 平 下 都 是 显著 的 , 其 中 ARO) Ree t 比 
最 小 为 -2.01. 模型 (4.10) 的 残 差 给 出 Q(12) = 9.9, Q(24) = 22.4, 这 表明 所 拟 合 模 
型 对 数据 序列 相关 性 的 描述 是 充分 的 . 注意 到 尽管 数据 已 经 经 过 季节 调整 , 然而 季 
节 AR 和 MA 系数 都 是 高 度 显著 的 , 标准 误差 分 别 为 0.05 和 0.045. 因此 , 季节 调 
整 的 充分 性 值得 进一步 研究 . 

为 了 给 数据 中 的 非 线性 性 建 模 , 我 们 应 用 TAR 模型 , 并 得 到 如 下 模型 


0.0699, -2 十 0.153 -3 十 0.1067 4 一 0.181 124-a1;, 若 Jt—1 SE 0.1. 
y 
"| 0.4019, + 0.208y,..5 — 0.1399, 12 + aap, 车 y1 >01, 


其 中 ap 的 标准 误差 分 别 为 0.183 和 0.223, 体制 1 中 AR 系数 的 标准 误差 分 别 为 
0.048, 0.044, 0.043 和 0.038, 而 体制 2 中 AR 系数 的 标准 误差 分 别 为 0.057. 0.060 
和 0.079. 体制 1 和 体制 2 中 的 数据 点 分 别 为 422 和 240. 模型 (4.11) 的 残 差 没有 
显示 出 任何 序列 相关 性 . 基于 所 拟 合 的 TAR 模型 , 当日 失业 率 的 变化 超过 0.1% 的 . 
数据 中 的 动态 依赖 关系 也 变 得 更 强 一 些 . 这 是 可 以 理解 的 , 因为 失业 率 的 大 的 上升 
是 美国 经 济 变 弱 的 预示 , 政策 制定 者 应 该 更 倾向 丁 采 取 措 施 来 帮助 经 济 , 这 反 过 来 
又 会 影响 失业 率 序列 的 动态 关系 . 因此 , 模型 (4.11) 能 够 描述 美国 失业 率 的 时 变动 
态 性 . 
模型 (4.10) 的 MA 表示 是 


(4.11) 


(B) = 1+ 0.01B + 0.15B? + 0.18B? + 0.16B* +- . 
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因此 u- 项 在 模型 (4.11) 中 没有 出 现 也 并 不 奇怪 . 

如 同 第 3 章 中 所 提 到 的 那样 , 门限 模型 在 金融 中 的 一 个 重要 应 用 是 处 理 波动 
率 对 正 、 负 收益 率 的 不 对 称 响 应 . 此 模型 也 可 用 来 研究 指数 期 货 和 现金 兑换 价格 中 
的 套利 交易 , 见 第 8 章 中 关于 多 元 时 间 序 列 的 讨论 . 这 里 我 们 只 把 注意 力 放 在 波动 
率 建 模 上 , 并 介绍 另外 一 种 对 TGARCH 模型 进行 参数 化 的 方法 .在 一 些 应 用 中 ， 
这 种 新 的 一 般 TGARCH 模型 要 比 第 3 章 中 的 GIR 模型 要 好 . 
例 4.3 我 们 考虑 BM 股票 的 日 对 数 收益 率 , 从 1962 年 7 A 3 口 到 2003 年 12 
月 31 日 共 10 446 个 观察 值 , 以 百分比 形式 给 出 并 已 包含 分 红 . 图 4-3 所 示 的 是 此 
序列 的 时 间 图 . 该 序列 是 本 书 所 分 析 的 较 长 的 收益 率 序 列 之 一 . 在 后 期 的 波动 率 看 
上 去 要 大 一 些 . 由 于 分 析 中 我 们 所 用 的 是 一 般 TGARCH 模型 , 所 以 该 例 中 我 们 用 
SCA 包 进 行 估计 . 
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图 4-3 IBM 股票 从 1962 47 A 3 H 2003 年 12 月 31 日 的 日 对 数 收益 率 的 时 间 图 


如 果 应 用 第 3 章 中 的 GARCH 模型 , 对 此 序列 我 们 得 到 如 下 的 AR(2)-GARCH 
(1,1) So 
rą = 0.062 — 0.024r, 5 + at, at = er, 
a? = 0.037 + 0.077a2 , + 0.91362 ,, 


其 中 r 是 对 数 收益 率 ，{fe} 是 均值 为 0、 方差 为 1 的 高 斯 白 噪 声 序列 ， 均 值 方差 
中 参数 的 标准 误差 分 别 是 0.015 和 0.010, 波动 举 方 程 中 的 标准 误差 分 别 是 0.004, 
0.003 和 0.003. 所 有 的 系数 估计 都 是 高 度 显 苦 的 . 标准 化 残 差 的 Ljung-Box 统计 量 
为 Q(10)=5.19(0.88), Q(20)—24.38(0.23), 其 中 括号 里 的 数 是 p (A. 对 标准 化 残 差 的 
平方 , Q(10)=11.67(0.31), Q(20)—18.25(0.57). 模型 在 刻画 数据 的 序列 相关 性 和 条 件 
异 方差 性 方面 是 充分 的 . 但 由 模型 (4.12) 得 到 的 无 条 件 均值 为 0.060, 要 比 样本 均 
值 0.039 大 一 些 , 这 显示 该 模型 可 能 错 了 . 
下 面 应 用 第 3 章 的 TGARCH 模型 得 到 


(4.12) 
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re = 0.014 — 0.02877 2 十 Qt， Qt =04Et, 


(4.13) 
of = 0.075 + 0.081P,_1a?_, + 0.157N,_102_, + 0.86302 , 


其 中 Pi = 1— Moa. Noa 是 aa 取 负 值 时 的 指示 变量 ， 即 满足 车 ai < 0, 
W Mo — 1, 否则 N_i = 0. 均值 方程 中 参数 估计 的 标准 误差 分 别 为 0.013 和 
0.009; 波动 率 方程 中 参数 估计 的 标准 误差 分 别 为 0.007, 0.008, 0.010 和 0.010. 除了 
均值 方程 中 常数 项 的 估计 外 , 所 有 其 他 的 估计 都 是 显著 的 . 记 a, 为 模型 (4.13) 的 
标准 化 的 残 差 . 对 {a}, 我 们 有 Q(10)=2.47(0.99), Q(20)=25.90(0.17); 对 {a2} 有 
Q(10)=97.07(0.00), Q(20)=170.3(0.00). 模型 不 能 很 好 地 刻画 数据 的 条 件 异 方差 性 . 

为 了 提高 对 波动 率 中 非 对 称 响应 建 模 的 灵活 性 , 可 用 TAR 模型 的 思想 来 改进 
此 模型 . 具体 地 , 我 们 对 该 序列 用 一 个 AR()-TAR-GARCH(.,1) 模型 . 得 到 


re = 0.033 — 0.023r%-2+a:, a, = oret, 


i (4.14) 
of = 0.075 + 0.041a?_; + 0.9030? , + (0.030a?_, 4- 0.06262 1)Ni 1， 


其 中 N_i 在 (4.13) 式 中 有 定义 . 模型 (4.14) 中 的 所 有 估计 在 1% 的 水 平 下 都 是 显 
著 地 不 同 于 零 的 . 令 a, 为 模型 (4.14) 的 标准 化 的 残 差 . 对 (a), 我 们 有 Q(10) = 
6.09(0.81), Q(20) = 25.29(0.19); 对 (a7) 有 Q(10)=13.54(0.20), Q(20)=19.56(0.49). 
因此 , 模型 (4.14) 能 充分 地 刻画 该 例 中 所 考虑 的 TBM 股票 日 对 数 收益 率 的 序列 相 
关 性 和 条 件 异 方差 性 . 模型 (4.14) 中 收益 率 的 无 条 件 均 值 是 0.033, 比 模型 (4.12) 和 
(4.13) 中 收益 率 的 无 条 件 均值 更 靠近 样本 均值 0.039. 比较 所 拟 合 的 两 个 TGARCH 
模型 , 我 们 看 到 日 IBM 股票 的 波动 率 中 的 非 对 称 性 要 比 在 GIR 模型 中 更 为 强烈 . 
具体 地 , 02 1 的 系数 也 依赖 于 ai 的 符号 . 注意 到 模型 (4.14) 可 以 进一步 改进 , 我 
们 可 以 增加 限制 要 求 当 a,_1 <0 时, 02, Al a2 ， 的 系数 之 和 为 1. 

注释 估计 AR(2)-TAR-GARCH(1,1) 模型 的 RATS 程序 将 在 本 章 附 录 A 中 
给 出 . 结果 可 能 与 文中 由 SCA 给 出 的 结果 略 有 不 同 . 口 
4.1.8 平滑 转移 AR(STAR) 模型 

对 SETAR 模型 的 一 种 批评 是 它 的 条 件 均值 方程 不 是 连续 的 . 门限 {yj} 是 条 
件 均 值 函数 jw 的 不 连续 点 . 鉴于 这 种 批评 , 人们 提出 了 平滑 的 TAR 模型 , 可 参见 


Chan 和 Tong (1986). Terüsvirta(1994) 以 及 这 两 篇 论文 的 参考 文献 . 称 时 间 序 列 
{zt} 服 从 两 个 体制 的 STA R(p) 模型 , 如 果 (o, RUE 


p p 
Zt.4—4A 
Lt = Cg + > dy itty - P (2-5 所 ) (e a > tse) + at, (4.15) 


i—1 ge 


其 中 d 是 延迟 参数 , ACRI s 是 模型 转移 的 平移 参数 和 尺度 参数 , FP) 是 一 个 平滑 的 
转移 函数 . 在 实际 中 , FC) 经 常 假定 为 三 种 形式 之 一 : Logistic 函数 、 指数 函数 或 一 
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个 累积 分 布 函数 . 由 (4.15) 式 , STAR 模型 的 条 件 均值 为 如 下 两 个 方程 的 加 权 线 性 
组 合 : 
p 
At = co 十 bs 00 iTt—is 


i=l 


p 
Hu = (co 十 ca) 十 》 (Go +14) rr. 


t 
权重 由 F (==) 以 一 个 连续 的 方式 决定 上 述 两 个 方程 也 决定 了 STAR BE 


型 的 性 质 . 例如 STAR 模型 平稳 性 的 必要 条 件 是 这 两 个 AR 多 项 式 的 零点 都 在 单 
位 圆 外 . STAR 的 优点 是 条 件 均值 函数 是 可 微 的 , 但 经 验 表 明 其 中 的 参数 A H s 是 
难以 估计 的 . 特别 地 , 大 多 数 实证 研究 表明 A A s 估计 的 标准 差 相 当 大 , t- 比 大 致 
为 1, JL Terásvirta(1994). 这 种 不 确定 性 会 导致 在 解释 所 估计 出 的 模型 时 复杂 性 较 
K. 

fil 4.4 我 们 用 3M (Minnesota Mining and Manufacturing) 公司 股票 从 1946 年 2 
月 到 1997 年 12 月 的 月 简单 收益 率 来 解释 STAR 模型 的 应 用 . 若 考虑 一 个 ARCH 
模型 , 我 们 得 到 如 下 的 ARCH(2) 模型 : 


Ri = 0.014 + at, at = over, of 一 0.003 十 0.108a2 1 + 0.15107 5, (4.16) 


其 中 各 估计 值 的 标准 差分 别 为 0.002, 0.000 3, 0.045 和 0.058. 如 同 前 面 讨论 的 , 这 
样 的 ARCH 模型 不 能 描述 股票 波动 率 对 正 、 负 “ 扰 动 ”的 不 对 称 反 应 . 用 STAR E 
型 可 以 克服 这 一 困难 . 把 STAR 模型 应 用 于 3M 股票 的 月 收益 率 , 我 们 得 到 
Ri=0.017+at, Qt = ore, 

0.002 — 0.314a2 , (4.17) 
1 4- exp(—1 000a, 1)" 
其 中 均值 方程 中 常数 项 的 标准 差 为 0.002, 而 波动 率 方程 中 的 各 估计 值 的 标准 差分 
373 0.000 3, 0.092, 0.056, 0.001 和 0.102， 为 了 简化 估计 , 转移 函数 的 尺度 参数 
1 000 是 事先 给 定 的 . 这 个 模型 为 对 正 负 “扰动 ”反应 的 不 对 称 性 提供 了 支持 . eh 
对 值 很 大 的 负 ari, 波动 率 模型 近似 为 ARCH(2) Ut. 


oF 一 0.002 十 0.256a2 , 十 0.141a2 ,. 
对 很 大 的 正 ati, 波动 率 过 程 近似 如 下 ARCH(2) BU: 
o; = 0.005 — 0.058a?_; + 0.141a?_». 


此 模型 中 a?_， 的 系数 为 负 , 这 与 直观 相 违 , 但 绝对 值 很 小 . 事实 上 , 对 较 大 的 正 扰 
动 a,-1, ARCH 效应 较 弱 , 即使 参数 估计 仍然 是 统计 显著 的 . 计算 时 所 用 的 RATS 
程序 将 在 附录 A 中 给 出 . 


a? = (0.002 + 0.256a2_, + 0.141a?_,) + 
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41.4 马尔 可 夫 转 换 模型 


在 非 线性 时 间 序 列 分 析 中 使 用 概率 转移 的 思想 在 Tong (1983) 中 有 讨论 . 利用 
类 似 的 想法 , 但 强调 一 个 经 济 量 在 各 个 状态 之 间 的 非 周 期 转移 , Hamilton (1989) 考 
虑 了 马尔 可 夫 转 换 白 回归 (MSA) 模型 . 这 里 转移 由 一 个 隐 含 的 两 个 状态 马尔 可 夫 
链 驱 动 . 称 时 间 序 列 Cr, IRA MSA 模型 , 如 果 xz, 满足 


p 
cl 十 Y brite Hain WR s,=1, 
Tt = A (4.18) 
C2 十 3 onini caa, WR s, =2, 
r—1 
其 中 s, 是 在 位 ,2?} 中 取 值 的 马尔 可 夫 链 , 转移 概率 为 


P(g = 264 = Lim 04, P(s_ = 184-1 = 2) = we. 


新 息 序列 {air}, {aor} 都 是 均值 为 零 、 方 差 有 限 的 独立 同 分 布 随机 变量 序列 , 并 且 
两 序列 之 间 是 相互 独立 的 ， 较 小 的 o; 意味 着 模型 在 状态 i 上 停留 更 长 的 时 间 . 事 
Sk E, 1/wi 是 过 程 停留 在 状态 i 上 的 期 望 持续 时 间 长 度 . 由 定义 可 见 , MSA 模型 是 
利用 一 个 隐 含 的 马尔 可 夫 链 来 掌握 从 一 个 条 件 均 值 函数 到 另 一 个 条 件 均 值 函数 的 
转移 . 这 与 SETAR 模型 不 同 . 在 SETAR 模型 中 转移 由 一 个 具体 的 延迟 变量 来 决 
XE. 总 之 , SETAR 模型 以 一 个 确定 的 方案 来 掌握 模型 的 转移 , 而 MSA 以 一 个 随机 
体制 来 掌握 模型 的 转移 .在 实际 中 , 由 于 状态 的 随机 性 , 在 MSA 模型 中 不 能 确定 
zt 属于 哪 一 个 状态 ， 当 样本 容量 很 大 时 , 可 利用 一 些 滤波 方法 来 对 mm 的 状态 作出 
HEMT. 然而 对 SETAR BUS, 只 要 r, a 被 观察 到 了 , x, 的 体制 就 已 知 了 . 这 个 差别 
在 预测 时 有 重要 的 实际 涵义 . 例如 , MSA 模型 的 预测 总 是 由 各 个 状态 下 的 子 模型 产 
生 的 预测 的 线性 组 合 , 但 对 SETAR 模型 , 一 旦 z, 4 被 观察 到 了 , 其 预测 就 是 单个 
体制 下 的 预测 , 而 如 果 预 测 步 长 超过 延迟 d, SETAR 的 预测 也 是 各 个 体制 下 预测 的 
线性 组 合 . MSA 模型 的 估计 要 比 其 他 模型 困难 得 多 , 因为 状态 不 是 可 直接 观察 的 . 
Hamilton (1990) 采用 EM 算法 来 估计 MSA 模型 . EM 算法 是 一 种 在 取 期 望 和 取 最 
大 值 之 间 重 复 迭 代 的 统计 方法 . McCulloch 和 Tsay (1994) 考虑 用 马尔 可 大 链 蒙特 
卡 罗 (MCMC) 方法 估计 一 般 的 MSA 模型 . 我 们 在 第 12 章 将 讨论 MCMC 方法 . 
McCulloch 和 ‘say (1993) 把 (4.18) 式 的 MSA 模型 进行 了 推广 , 允许 转移 概 
率 wl 和 wo 为 Logistic 的 或 者 是 概率 值 的 , Jf ELTE t-1 时 刻 可 获得 一 些 解 释 变 量 
的 函数 . Chen, McCulloch 和 Tsay (1997) 用 马尔 可 夫 转 换 的 思想 作为 工具 来 对 非 
嵌 套 的 非 线性 时 间 序 列 模型 进行 比较 和 选取 (例如 , 比较 双 线性 模型 和 SETAR 模 
型 )， 每 一 个 候选 模型 用 一 个 状态 来 表示 . 这 种 选择 模型 的 方法 是 贝 叶 斯 分 布 中 常 
用 的 机 会 比 (odds ratio) 方法 的 推广 , 另外 , MSA 模型 可 以 容易 地 推广 到 多 个 状态 
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(多 于 两 个 状态 ) 的 情形 , 但 计算 量 将 迅速 增加 . 对 计量 经 济 学 中 关于 马尔 可 夫 转 换 
模型 更 多 的 讨论 , 请 参见 Hamilton (1994) 的 第 22 章 . 
例 4.5 “考虑 美国 的 实际 国民 总 产值 (GNP) 的 季度 增长 率 , 时 间 段 是 1947 年 第 
二 季度 到 1991 年 的 第 一 季度 , 以 百分比 形式 给 出 . 图 4-4 是 经 过 季节 调节 的 数据 的 
时 间 图 , 其 中 有 一 条 水 平 的 零增长 线 . 可 见 大 多 数 增长 率 是 正 的 . 这 个 序列 在 经 济 
时 间 序 列 的 非 线性 分 析 中 被 广泛 应 用 .Tiao 和 Tsay (1994) 以 及 Potter (1995) 用 
TAR EJ. Hamilton (1989) 以 及 McCulloch 和 Tsay (1994) 用 马尔 可 夫 转 换 模 型 
都 研究 过 此 序列 . 

采用 当 p=4 时 (4.18) 式 的 MSA 模型 ,用 MCMC 方法 (第 12 章 中 将 讨论 )， 
McCulloch 和 Tsay (1994) 得 到 的 估计 列 在 表 4-1 rn. 


1950 1960 1970 1980 1990 
年 


图 44 美国 实际 GNP 季度 增长 率 的 时 间 图 , 时 间 段 为 1947. 11 —1991. 1. 数据 经 过 季节 
性 调节 、 并 以 百分比 形式 给 出 


X 4-1 对 美国 实际 GNP 的 季度 增长 率 (经 季节 调节 ) 运用 p — 4 时 的 MSA 模型 的 估计 


结果 ° 

参数 Ci $i de $a pa Ti wy 
状态 1 

估计 0.909 0.265 0.029 0.126 -0.110 0.816 0.118 

标准 差 0.202 0.113 0.126 0.103 0.109 0.125 0.053 
状态 2 

估计 0.420 0.216 0.628 -0.073 —0.097 1.017 0.286 

标准 差 0.314 0.347 0.377 0.364 0.404 0.293 0.064 


a 估计 值 和 它们 的 标准 差 是 5 000 次 迭代 的 Gibbs 抽样 的 后 验 均值 和 标准 差 . 


结果 中 有 几 点 有 趣 的 发 现 . 第 一 , 状态 1 下 边缘 模型 的 平均 增长 率 为 0.909/(1 一 
0.265 — 0.029 十 0.126 十 0.11) = 0.965, 状态 2 下 边缘 模型 的 平均 增长 率 为 -0.42/(1 一 
0.216 — 0.628 + 0.073 + 0.097) = —1.288. 这 样 , 状态 1 对 应 有 正 增长 率 的 季度 或 
膨胀 期 , 状态 2 对 应 有 负增长 率 的 季度 或 紧缩 期 . 第 二 , 状态 2 下 参数 估计 的 相对 
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较 大 的 标准 差 反 应 出 在 这 个 状态 的 观察 值 较 少 , 这 一 点 可 从 图 4-4 中 看 出 , 较 少 的 
季度 具有 负增长 率 . 第 三 , 对 不 同 的 状态 , 转移 概率 会 不 同 , 走出 紧缩 期 的 概率 较 大 
(0.286 对 0.118). 第 四 , 把 1/w; 当 作 停留 在 状态 i 的 平均 持续 时 间 长 度 , 我 们 看 到 
紧缩 斯 和 膨胀 期 的 平均 长 度 分 别 大 约 是 3.69 和 11.31 季度 . 这 样 , 平均 起 来 , 美国 
经 济 的 紧缩 大 致 持续 1 年 , 而 膨胀 大 致 持续 3 年 . 最 后 , 两 个 状态 下 rea 的 AR 系 
数 的 估计 值 差别 很 大 , 显示 出 美国 经 济 的 动态 规律 在 紧缩 期 和 膨胀 期 是 不 同 的 . 


4.31.5 “ 非 参 数 方法 


在 一 些 金融 应 用 中 , 我 们 可 能 没有 足够 的 信息 来 确定 两 个 变量 Y 和 久之 间 的 
非 线性 结构 ， 我 们 希望 可 以 在 其 他 应 用 中 利用 计算 设备 和 计算 方法 上 的 进展 来 探 
BY 与 X 之 间 的 函数 关系 . 这 就 要 用 到 非 参数 的 方法 和 技巧 . 然而 , 非 参 数 方法 
的 运用 不 是 没有 代价 的 . 它们 高 度 地 依赖 于 数据 并 容易 导致 过 度 拟 合 (overfitting). 
本 节 的 目的 是 要 介绍 金融 应 用 中 的 一 些 非 参 数 方 法 和 利用 非 参 数 方 法 的 ” 些 非 线 
性 模型 所 讨论 的 非 参 数 方法 包括 核 回 归 (Kernel regression)、 局 部 最 小 二 乘 估计 
和 神经 网 络 . 

非 参 数 方法 的 本 质 是 “平滑 * (smoothing). 考虑 西 个 金融 变量 Y A X. 满足 


Y, = m(X;) 十 ap (4.19) 


其 中 mi) ee (a. HE ERSTE TU. 我 们 想 由 数据 去 估计 非 线 
性 函数 m ). 为 了 简单 起 见 , 考虑 X = x 这 个 特定 的 时 候 mm(.) 的 估计 问题 , 也 就 
是 m(x) ae 假定 对 应 X = z, 我 们 有 重复 独立 的 观察 y ,yr, 则 数据 
变 为 

二} = 


对 数据 取 平 均 得 到 


T T 
Eta yt = at 


= m(x) + 


由 大 数 定 律 , 4 T ÉF oo 时 “扰动 ”的 平均 趋 于 0, 故 了 = 3 miT 是 mle) 的 一 


个 相合 估计 . 了 提供 了 mic) 的 一 个 相合 估计 ， 或 者 说 扰动 的 平均 趋 于 零 这 个 事实 
显示 出 了 平滑 的 作用 . 

在 金融 时 间 序 列 中 , 在 X = z 点 我 们 不 能 有 重复 的 观察 . 所 观察 到 的 是 
[ues c) t = 1,… T. 但 如 果 函 数 m() 是 充分 光滑 的 , 对 应 于 X, = or 的 那些 
Y, 的 值 仍然 可 以 提供 mm(z) 的 较为 精确 的 近似 ， 而 对 应 于 远离 x 的 X, 的 那些 Y, 
的 值 就 不 能 提供 对 mz) 的 较 好 近似 . 作为 折 中 , 估计 mla) 时 人 们 用 ye 的 加 权 平 
均 来 代替 简单 的 平均 . 权重 应 满足 : 对 应 于 x 附近 的 X, 的 那些 Y, 所 给 权重 较 大 ， 
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而 对 应 于 远离 z 的 X, 的 Yi 所 给 权重 较 小 . 数学 表达 上 , 对 给 定 x, m(z) 的 估计 为 
. Í 去 

(s) 一 元 2. w(x)ye, (4.20) 


其 中 权重 we(z) 满足 : 对 应 于 m 附近 的 r 的 ye 所 给 wi(z) BEA, 对 应 于 远离 x 的 
zt 的 六 所 给 的 wila) BUD. Z (4.20) 中 , 我 们 假定 所 有 权重 之 和 为 T. 也 可 以 把 
V/T 看 作 权 重 的 一 部 分 , 而 权重 之 和 为 1. 

由 (4.20) 式 ， mia) 只 是 一 个 局 部 加 权 平 均 (local weighted average), 其 中 权重 
由 两 个 因素 决定 . 第 一 个 因素 是 距离 (zt 与 z 之 间 的 距离 ); 第 二 个 因素 是 对 给 定 
的 距离 权重 的 分 配 . 不 同 的 距离 度量 方法 和 不 同 的 权重 分 配 将 产生 不 同 的 非 参 数 
方法 . 下 面 讨论 通常 使 用 的 核 回 归 和 局 部 线性 回归 方法 . 

核 回归 

核 回归 也 许 是 最 常用 的 平滑 非 参数 回归 方法 . 这 时 的 权重 由 一 个 核 函 数 决定 
典型 的 核 函 数 是 概率 密度 函数 , 一 般 记 为 K(z), 满足 


K(x) 0, | «cx: eb 


为 了 增强 在 距离 度量 上 的 灵活 性 , 人 们 往往 用 一 个 变量 h> 0 ee ACE RE 
化 


二 ~K(2/h), | Kissi, (4.21) 
这 里 的 h 称 为 窗帘 (bandwidth). 权 函 数 定义 为 
uz) = — ane — T0) (4.22) 


a» Ky (r — 2) 
其 中 分 母 是 一 个 标准 化 常数 , 它 使 得 平滑 能 适应 于 变量 X 的 局 部 强度 而 且 权 重 之 
和 为 1. 把 (4.22) 式 代入 平滑 公式 (4.20) 中 , 我 们 得 到 著名 的 Nadaraya-Watson 核 
= = Y Kal 

] i1 Kp(z — Tt) 

mla) 之 ee)u = YT. alessi , 
具体 可 参见 Nadaraya(1964) 和 Watson(1964). 在 实际 中 ， 有 很 多 核 函数 可 供 选 择 . 
然而 , 从 理论 和 实际 应 用 的 两 个 角度 考虑 , 只 有 几 种 核 函 数 是 常用 的 , 其 中 包括 高 
Nr Ez pe T 


(4.23) 


ita) neo (3) 
dm hvV2n PY on)” 
和 Epanechnikov 核 (Epanechnikov(1969)) 


5 0.75 a? T 
Hüte eve (: E 29:053 s 1), 
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其 中 (A4) 是 一 个 示 性 函数 : 若 4 成 立 则 T(A) = 1, 否则 (A) — 0. 图 45 所 示 的 
是 当 二 1 时 高 斯 核 和 Epanechnikov 核 的 图 像 . 


4-5 标准 高 斯 核 ( 实 线 ) 和 Epanechnikov 核 (MER), 窗 宽 均 为 h==1 


为 了 理解 窗 宽 h 所 起 的 作用 , 我 们 米 评价 一 些 带 Epanechnikov 核 的 Nadaraya- 
Watson 估计 在 观察 值 {z:} 上 的 表现 . 考虑 两 个 极端 情形 : 第 一 , 车 hh 一 0, XU 


这 表明 很 小 的 h 会 重 现 数 据 本 身 ; 第 二 , E ho +00, W 


"EWROTUULSO OMNE EP 
mar) YT. Ka (0) T 2. yu = Y, 
说 明 很 大 的 h 会 导致 过 度 平 滑 曲 线 一 一 样本 均值 . 一 般 地 , 窗 宽 h 的 作用 如 下 : 
当 hh 很 小 时 , 权重 只 集中 在 每 个 x, 邻 域内 的 少数 观察 值 上 ; 当 h 很 大 时 , 权重 会 
分 散 到 m, 的 较 大 邻 域内 . 总 之 , h 的 选择 在 核 回 归 分 析 中 起 着 重要 作用 . 这 就 是 核 
回归 中 有 名 的 窗 宽 选 择 问题 . 

窗 宽 的 选择 


窗 宽 的 选择 有 几 种 方法 , 可 参见 Hiirdle (1990) 以 及 Fan 和 Yao(2003)， 第 一 


种 方法 是 塞 入 法 (plug-in method), 该 方法 基于 比较 平滑 的 核 函 数 的 积 和 均 方 误差 
(MISE) 的 渐 近 展开 . 考虑 


MISE = E | T upto), 
其 中 m(.) 是 真实 函数 . MISE 中 的 量 已 部 (z) 一 m(z)] 2 是 对 在 zx 点 的 估计 值 (e) 的 
均 方 误差 (MSE) 的 一 个 点 的 度量 . 在 某 些 正则 性 条 件 下 , 我 们 可 通过 最 小 化 MISE 
得 到 最 优 窗 宽 . 最 优 窗 宽 一 般 依赖 于 待 估 的 未 知 量 . 这 些 未 知 量 必须 由 数据 用 某 种 
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ge e ac FERNER. 
初步 平滑 去 估计 . 要 得 到 合理 的 最 优 窗 宽 估 计 , APB Se BAR, 在 实际 应 用 中 , 初步 
平滑 的 选择 是 一 个 问题 . Fan 和 Yao(2003) 给 出 了 一 个 正 态 参考 窗 宽 选 择 


1.008T-!/9, 高 斯 核 , 
- 2.348T-"/*.  Epanechnikov f. 


其 中 s 是 平稳 独立 随机 变量 的 样本 标准 差 . 
窗 宽 选 择 的 第 二 种 方法 是 漏 掉 一 个 观测 的 交叉 验证 (cross-validation). 第 一 步 ， 
去 除 一 个 观测 (z;,y;). 用 剩 下 的 0 —1 Ne rj 点 的 平滑 : 


rj (zz) = = 》 wel (wj) ye. 
txEj 
它 是 y; 的 一 个 估计 值 , 其 中 权重 w(xwj) 的 和 为 了 一 1. 第 二 步 , 对 j 1, 7 都 
做 第 一 步 , 并 且 定 义 函数 


T 
CV (h) = 72 [yj tian, j (;)]?W (2.5), 


其 中 wo) 是 一 个 非 负 的 权重 函数 , 满足 5 W(zr,)-— T. 如 果 必 要 , 它 可 用 来 降低 


边界 点 上 的 权重 . 因为 对 于 接近 边 输 的 点 ， 通常 只 有 很 少数 的 数据 点 与 之 相 邻 , 所 
以 有 降低 它们 权重 的 必要 . 函数 CV (h) 称 为 交叉 验证 函数 , 这 是 因为 它 验证 了 平滑 
函数 预测 (uh 的 能 力 . 我 们 可 以 通过 最 小 化 CV(.) 来 选择 窗 宽 . 

局 部 线性 回归 法 


假定 (4.19) 式 中 m(.) 的 二 阶 导数 存在 , 并 且 在 点 z 处 连续 , 这 里 z 是 m(.) 支 
撑 中 的 一 个 给 定 的 点 . 记 能 获得 的 数据 为 {(y, zi)} 守 ;， 非 参数 回归 中 的 局 部 线性 
回归 法 就 是 要 找 出 a A b, 使 下 式 达 最 小 值 : 


L(a,b) = 2, [yy — a — b(z — z,)]? Ky (z — 2), (4.24) 
其 中 Ki(.) 是 (4.21) 式 中 的 核 函数 , h 是 窗 宽 . 记 a 的 估计 值 为 & 则 m(x) 的 估计 
XE XU à. 在 实际 中 , 假定 = 是 独立 随机 变量 的 观测 值 . f HE ou 可 以 作为 对 mi) 
的 一 阶 导 数 在 x 点 取 值 的 估计 . 
在 最 小 二 乘 的 理论 下 , (4.24) 式 是 一 个 加 权 最 小 二 乘 问题 , 并 且 我 们 可 以 推导 
出 a 的 显 式 解 . 具体 地 , 求 L(a,5) 关于 a 和 的 偏 导数 , 然后 令 偏 导 数 等 于 0 我 
们 得 到 有 两 个 未 知 数 的 两 个 方程 : 


T T T 
>> Kala — tije = a Ky(z — 2) + b> _ (z — 24) Ka (x — 2), 
t=1 t=1 


r=], 
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S wes z,)Kyu(z — x) sd ee a) Ky(r — 24) + HLG z — zy)! Kp(x — t). 


t=1 t=1 t=1 
定义 
ST 一 六 “他 -z — 2), l= 0,1, 2. 


t=1 


上 述 两 个 方程 变 为 


T 
2, Kus 一 T()W 

Fe i. t=1 

STi ST2 b > 


(r — z,)Kpy(r — rt)yt 


从 而 , 我 们 有 


sr2 Yi Kalt — 21) ue — 574 Zi- 1 (@ — T4) Kn(e — vy 
B ST'O0ST,2 一 sT. 1 
BERIT RE 


T 
aci T — Tt) — STA 2. — z,)Ky(r — zi)yi 


t=1 


T 
= [Ki — zi)(sr2 — (r— Ti)STA Jyt 
t=1 


T 
n(x — m)sra — > (i — ee) Kn(w — 2) 57,1 


dee E 
3 


2 
8T,08T,2 一 87,1 = 


Ky (x — vi)lsT2 — (£ — zi)sr4]. 


综合 之 , 我 们 有 
B. TOLA (4.25) 
> 1 t 
其 中 wt 定义 为 
= Ky(r — x)|s7,2 — (x — 24) 87,1). 
在 实际 应 用 中 , 为 了 避免 分 母 为 0 的 情况 , 我 们 使 用 m(z) 的 如 下 估计 : 
^ ~ yu UL yt 4.26 
in Yid de ais 


注意 到 (4.26) 式 有 一 个 很 好 的 特性 , 就 是 权重 o, 满足 
T 
». (x — Tt Jwt = 
t=1 
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另外 , 如 果 只 假定 (4.19) AF m) 有 一 阶 导数 , 通过 求 


X (ye — a)? Kn (2 — 2) 

t—1 
的 最 小 值 点 , 可 得 到 前 面 介绍 过 的 Nadaraya Watson 估计 . 一 般 地 , 如 果 假 定 m) 
HARR k 阶 导 数 , 则 可 用 一 个 (ko 1) 次 多 项 式 代 替 (4.24) 式 中 的 线性 多 项 式 . 
我 们 把 (4.26) 式 中 的 估计 称 为 局 部 线性 回归 平滑 . Fan(1993) 证 明了 在 某 些 正 则 条 
件 下 局 部 线性 回归 有 某 些 重要 的 抽样 性 质 ， 窗 宽 的 选择 可 以 用 与 前 面 讨 论 过 的 相 
同 的 方法 得 到 . 

时 间 序 列 的 应 用 


在 时 间 序 列 分 析 中 , 解释 变量 通常 是 序列 的 延迟 值 . 考虑 单个 解释 变量 的 简单 
情形 . 这 时 模型 (4.19) 变 成 


T; = o m(ri a) + ai. 


可 以 直接 应 用 前 面 所 讨论 过 的 核 回归 和 局 部 线性 回归 方法 . 当 有 多 个 解释 变量 存 
在 时 , 需要 作 一 些 修 改 后 再 用 非 参数 方法 . 对 核 回归 , 我 们 可 以 用 多 元 核 函数 , 如 其 
有 给 定 协 方差 矩阵 的 多 元 正 态 密度 函数 


K),(x2) 一 = ia 


cT; 


hj 


1 d 
(hv2n)s|Xju2 "P V 202 
Hp p 是 解释 变量 的 个 数 , 习 是 事先 给 定 的 正定 矩阵 . 也 可 以 用 一 元 核 函 数 的 乘积 
作为 多 元 核 函 数 , 例如 
所 0.75 x? " 
Koo) = 1; C-i) «t. 
这 一 方法 比较 简单 , 但 忽略 了 解释 变量 之 间 的 关系 ， 
例 4.6 为 了 说 明 非 参数 方法 在 金融 中 的 应 用 , 考虑 二 级 市 场 上 从 1970 年 到 1997 
年 3 个 月 期 国库 券 的 周 利率 , 共 1 460 个 观测 . 数据 是 从 圣 ， 路 易 斯 联邦 储备 银行 
(Federal Reserve Bank of St Louis) 得 到 的 , 图 4-6 给 出 了 数据 的 时 间 图 . 这 些 序列 
在 文献 中 经 常用 到 . 作为 用 直接 观测 数据 估计 随机 扩散 方程 的 例子 , 读者 可 参见 第 
6 章 的 参考 文献 . 这 里 我 们 考虑 一 个 简单 模型 : 
Ye = p(T dt + o (Tt )dus, 
其 中 a, 是 3 个 月 期 国库 券 利率 , y, = zi 一 rri, us 是 标准 布朗 运动 ul) 和 ol) 
是 zt-i 的 光滑 函数 . 应 用 S-Plus 中 局 部 光滑 函数 lowess 可 得 到 pu(-) 和 o() 的 非 


参数 估计 , 详细 可 参见 Cleveland(1979). 为 简单 起 见 , 我 们 用 |y,| 作为 x, 波动 率 的 
代表 . 
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1970 1975 1980 1985 1990 1995 


图 46 二 级 市 场 上 从 1970 年 到 1997 年 3 个 月 期 国库 券 的 周 利率 的 时 间 图 


对 于 上 述 所 考虑 的 简单 模型 , p(er) 是 给 定 re 时 y 的 条 件 均值 , 即 uler) 
= E(ylzi i). 图 47a 给 出 了 y(t) 对 m, BORA. 该 图 还 包含 由 S-Plus 中 的 
lowess 所 得 到 的 u(z, 1) 的 局 部 平滑 估计 , 估计 本 质 上 是 0. 然而 , 为 了 更 好 地 理 
解 该 估计 , 图 4-7b 给 出 了 更 精细 刻度 下 的 估计 值 Alei) 我 们 发 现 一 个 很 有 趣 的 
现象 ; 当 c 的 值 很 小 时 , Ale) 是 正 的 ; 而 当 zi 的 值 很 大 时 , Ale) 变 成 了 负 


(a) 


0.015 


abs! y) 


0.005 


0.0 


0.001 0.008 
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Bd 4-7 通过 局 部 平滑 方法 所 给 出 的 3 个 月 期 国库 券 的 周 利率 的 条 件 均 值 和 波动 率 的 估计 : 
(a) ye 对 re-i, 其 中 ye = tt — mias zt 是 利率 ; (b) jp(zt-1) 的 估计 ; (c) lyel 对 mci: 
(d) cf(zt-i) 的 估计 
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的 . 这 与 常识 相 一 致 : 即 当 利率 很 高 时 , 期 望 其 下 降 ; 而 当 利率 很 低 时 又 期 望 其 上 
Ff- 4-7c 给 出 了 ly(t)| 对 xí. 的 散 点 图 , 估计 lze) 由 lowess 给 出 . 该 图 进 一 
步 证 实 了 , 利率 越 高 , 波动 率 越 大 . 图 47d 给 出 了 更 精细 刻度 下 的 估计 值 o (aa). 
可 以 很 清楚 地 看 到 波动 率 是 z,_1 的 增 函数 , 当 zt_i 达到 10% 时 斜率 在 增加 .这 
个 例子 说 明了 简单 的 非 参数 方法 在 理解 金融 时 间 序 列 的 动态 结构 时 很 有 用 . 


例 4.6 中 所 用 到 的 S-plus 命令 


> zl=matrix (scan (file='w-3mtbs7097.txt’) ,4) 

> x=z1[4,1:1460]/100 

y-(z1[4,2:1461] -21[4,1:1460] ) /100 

par (mfcol=c (2, 2)) 

plot (x, y, pch-' *', xlab=’x(t-1)’,ylab="y(t) ‘) 

lines (lowess (x, y) ) 

title(maine’ (a) y(t) vs x(t-1)’) 

fit=lowess (x,y) 

plot (fit$x,fit$y,xlab-'x(t-1)',ylab-'mu',type-'1l', 
ylim= c(-.002,.002)) 

title(main-' (b) Estimate of mu(.)') 

plot (x, abs (y) , pch-' *' , xlab-'x(t-1)',ylab-'abs(y)') 
lines (lowess (x,abs(y))) 

title(main-' (c) abs(y) vs x(t-1)’) 

fit2=lowess (x, abs (y) ) 

plot (fit2$x, fit2$y,type='1’ ,xlab='x(t-1)',ylab='sigma’, 
ylim= c(0,.01)) 

title(main=’ (d) Estimate of sigma(.)’) 


下 面 介绍 几 个 由 非 参 数 方法 导出 的 非 线性 时 间 序 列 模型 ， 
4.1.6 ”函数 系数 AR 模型 


非 参 数 方法 的 新 近 成 果 使 得 研究 人 员 在 提出 非 线 性 模型 时 可 以 放松 参数 型 的 
约束 . 有 些 情 形 下 , 非 参数 方法 用 来 对 数据 进行 初步 研究 , 以 帮助 选择 一 个 参数 型 非 
线性 模型 . Chen 和 Tsay (1993a) 采用 这 种 方法 , 提出 函数 系数 自 回 归 (functional- 
coefficient autoregressive, FAR) 模型 


T E Wow) ws VO WEAN VY yY 


Tt = fi(X t1) To fXCai)gmp + at, (4.27) 


其 中 Xii = (tiie Ttk) 是 由 v. 的 延迟 值 所 构成 的 向 量 . 如 果 有 必要 , X, 
可 以 包含 在 t 一 1 时 刻 已 知 的 其 他 解释 变量 . (4.27) 式 中 的 AO 往往 假定 是 几乎 处 
处 连续 、 甚 至 是 二 次 可 微 的 . 前 面 讨论 过 的 绝 大 部 分 非 线性 模型 都 是 FAR 模型 的 
特殊 情形 , 在 实际 应 用 中 , 我 们 可 用 非 参数 方法 (如 核 回 归 或 局 部 线性 回归 ) 来 估 
计 函 数 型 系数 fil), 特别 是 当 X, 的 维 数 较 低 的 时 候 可 以 这 样 做 (尤其 是 当 X,_， 
是 一 维 的 时 候 ). 最 近 , Cai, Fan 和 Yao (2000) 用 局 部 线性 回归 方法 去 估计 f. (C), 证 
明了 用 PAR 模型 可 以 在 向 前 1 步 预 测 上 获得 很 大 改进 . 
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4.1.7 非 线 性 可 加 AR. 模型 


把 非 参 数 方 法 应 用 到 非 线 性 时 间 序 列 分 析 中 的 一 个 主要 困难 是 “ 维 数 灾难 ” 
(curse of dimensionality). 考虑 一 个 一 般 的 AR(p) 过 程 ct = f(zici; i7 . 2p) + ai. 
直接 用 非 参数 方法 来 估计 fo) 将 需要 p 维 的 平滑 . 24 p 很 大 时 这 难以 做 到 , 尤其 是 
在 数据 点 的 个 数 不 是 很 多 时 .克服 这 一 困难 的 一 个 简单 而 有 效 的 方法 是 考虑 可 加 
模型 , 这 样 的 模型 只 需要 低 维 的 平滑 . 称 时 间 序 列 ce 服从 非 线性 可 加 AR( 简 记 为 
NAAR) 模型 , 若 


t= folt) + >. 万 (Ti 十 Qt， (4.28) 
二 | 
其 中 AO 是 几乎 处 处 连续 的 函数 . 因为 每 个 卢 (.) 只 有 一 个 自 变量 , 可 以 用 一 维 平 
滑 方 法 , 从 而 避免 维 数 灾难 . 在 应 用 中 , 在 给 定 UOJ x à 的 条 件 下 , 估计 fil). 这 
种 迭代 方法 可 用 来 估计 NAAR 模型 . 更 多 细节 和 NAAR 模型 的 例子 , 可 参见 Chen 
和 Tsay (1993b). 
可 加 性 的 假设 限制 性 相当 强 , 所 以 在 应 用 中 要 仔细 检验 .Chen, Liu 和 Tsay 
(1995) 考虑 了 检验 可 加 性 的 检验 统计 量 . 


4.1.8 ” 非 线 性 状态 空间 模型 


利用 MCMC 方法 的 最 新 进展 (Gelfand 和 Smith (1990)), Carlin, Polson Al 
Stoffer (1992) 提出 了 非 线 性 状态 空间 建 模 的 蒙特 卡 罗 方 法 . 所 考虑 的 模型 为 


Se = frlSe-1) H ut mo (St) + ve, (4.29) 


其 中 S, 是 状态 向 量 , f (C) 和 gu C) 是 依赖 某 些 未 知 参数 的 已 知 函数 , (uu) HAAS 
均值 、 非 负 定 的 协 方差 矩阵 Yu, 的 独立 同 分 布 的 多 元 随机 向 量 序列 , (os) 是 均值 为 
零 、 方 差 为 o2 的 独立 同 分 布 随机 变量 序列 , AL {wu} 与 {wr} 独立 . 因为 对 于 一 个 非 
线性 系统 , 需要 给 定 Si 的 条 件 下 S, 的 整个 条 件 分 布 , 所 以 蒙特 卡 罗 方 法 可 用 来 
处 理 状态 转移 方程 的 非 线性 演变 . Kitagawa (1998) 及 其 参考 文献 中 考虑 了 其 他 的 
对 非 线 性 时 间 序 列 分 析 的 数值 平滑 方法 . MCMC 方法 (或 者 一 些 高 强度 计算 的 数 
值 方法 ) 是 非 线性 时 间 序 列 分 析 的 有 力 工具 , 但 这 些 方法 的 潜力 还 没有 充分 发 据 出 
来 . 然而 , (4.20) 式 模型 中 假定 了 f, 0) 和 g C) 的 形式 已 知 , 这 是 在 实际 应 用 中 运用 
上 述 方法 的 障碍 . 克服 这 一 局 限 的 方案 是 , 使 用 诸如 对 FAR 和 NAAR 模型 分 析 时 
所 用 的 非 参数 方法 , 在 用 非 线 性 状态 空间 模型 之 前 对 fel) 和 gl.) 进行 具体 化 . 


4.1.9 ”神经 网 络 


现代 数据 分 析 的 一 个 常见 问题 就 是 神经 网 络 ， 神 经 网 络 方法 可 归 类 为 半 参 数 
方法 . 有 关 神 经 网 络 的 文献 非常 多 . 它 在 很 多 学 科 中 有 应 用 , 且 应 用 成 功 的 程度 也 
不 尽 相同 , 具体 可 参见 Ripley (1993) 的 第 2 节 所 列 的 应 用 以 及 第 10 节 中 关于 其 在 
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金融 中 应 用 的 评注 . Cheng 和 Titterington (1994) 提供 了 从 统计 学 角度 看 神经 网 络 
的 信息 . 本 节 主 要 关注 “前 馈 "(feed-forward) 神经 网 络 . 它 将 原始 信息 输入 到 由 一 
个 或 几 个 神经 元 (或 称 为 结 点 ) 构成 的 输入 层 , 而 这 些 结 点 向 前 连接 到 下 一 层 , fi 
到 到 达 输 出 层 . 图 4-8 举 了 一 个 简单 的 例子 . 它 是 带 有 一 个 陷 层 的 、 用 来 处 理 -元 
时 间 序 列 分 析 的 简单 的 前 馈 神 经 网 络 . 其 输入 层 有 两 个 结 点 , 隐 层 有 三 个 结 点 . 输 
入 层 的 每 个 结 点 都 向 前 连接 到 每 个 隐 层 的 结 点 上 , 而 这 些 隐 层 的 结 点 都 连接 到 输出 
层 的 一 个 单独 结 点 . 我 们 称 这 个 网 络 为 一 个 2-3-1 的 前 馈 神经 网 络 . 更 多 复杂 的 神 
经 网 络 包括 那些 带 回 馈 连 接 的 网 络 部 已 经 在 文献 中 提出 , 但 与 我 们 学 习 关 系 最 多 的 
还 是 前 馈 神经 网 络 . 


>a 
Ex 


图 4-8 一 个 用 于 处 理 一 元 时 间 序 列 分 析 的 带 有 一 个 隐 层 的 前 馈 神 经 网 络 


前 馈 神 经 网 络 


神经 网 络 由 一 层 向 下 一 层 处 理 加工 信 息 是 通过 一 个 “激活 函数 ” (activation fuc- 
tion) 来 完成 的 . 考虑 带 有 一 个 隐 层 的 前 馈 神 经 网 络 , 隐 层 的 第 j 个 结 点 定义 为 


hj = fi (a0, i i Yuya), (4.30) 
t—7 
其 中 z; 是 输入 层 第 i 个 结 点 的 值 , fj(.) 是 一 个 激活 函数 , 典型 的 是 取 logistic BR 
数 : 
|.  exp(z) 
fi(2) = 1+ exp(z)’ 

aoj 称 为 偏差 , 对 ;一 j 求 和 是 指 对 输入 层 中 所 有 指向 j 的 结 点 求 和 ， wij 是 权重 . 
比如 在 图 4-8 中 的 2-3-1 前 馈 神 经 网 络 的 隐 层 中 的 第 j 个 结 点 : 
_  exp(aoj 十 21 + wojr2) 
d exp(a@oj + wijzi + wojc3)' 


输出 层 的 结 点 定义 为 


j21,2,3. (4.31) 


了 


vee (os. ES » io) (4.32) 


j-o 


其 中 激活 函数 fo (-) 是 线性 函数 或 Heaviside 函数 . 如 果 fo(-) 是 线性 函数 , 则 


k 
O = Q00 + > Wwiohj, 
了 
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其 中 大 是 隐 层 中 结 点 数目 . 一 个 Heaviside 函数 中 有 这 样 的 定义 : 如 果 z > 0, 则 
f.(z) — 1, 否则 folz) = 0. 把 带 有 Heaviside 函数 的 神经 元 称 为 门限 神经 元 , 1" 代 
表 神 经 元 发 出 信息 . 例如 , 考虑 图 4-8 中 的 2-3-1 网 络 , 如 果 激 活 函 数 是 线性 的 , 则 
其 输出 值 是 


0 一 aoo 十 Miohi + wash + wsoha; 
如 果 fol) 是 一 个 Heaviside 函数 , 则 输出 值 是 


P 1, MER aoo + wiohs + wooha + Waohs > 0, 
0, mR Goo + Wiohi + Wephe + washa € 0. 


联合 各 个 层 来 看 , 前 馈 神经 网 络 的 输出 值 可 以 写成 


gs f£ fev d a wyofj;(Qo0; + E wn] à (4.33) 
如 果 允 许 输 入 层 直 接连 接 到 输出 层 , 则 该 网 络 变 成 
0 — fo [av ru > Orio j4- bF Wo fj (a0; $3 X gni) , (4.34) 
io j—o ij 


其 中 第 一 个 求 和 号 是 对 输入 结 点 求 和 . 当 输 出 层 的 激活 函数 是 线性 的 , 输入 层 到 输 
出 层 的 直接 连接 意味 着 输出 值 是 输入 值 的 一 个 线性 函数 .从 而 在 这 个 特殊 情形 下 ， 
(4.34) 式 是 线性 模型 的 一 般 形 式 . 对 于 图 48 的 2-3-1 网 络 , 如 果 输 出 激活 函数 是 
线性 的 , 则 (4.33) 式 变 成 


3 
Ó = Ooo | > wiohj, 
j=1 


其 中 在 (4.31) 式 中 给 出 . 从 而 该 网 络 有 13 个 参数 . 如 果 用 (3.34) 式 , 则 网 络 变 
为 


2 3 
0 二 Qdo + > Qin + 》 Wyoh;, 
i=1 J= 


其 中 h; 在 (4.31) 式 中 给 出 . 网 络 参数 的 数 日 增加 到 15 个 ， 

我 们 称 等 式 (4.33) 或 (4.34) 中 的 函数 是 半 参 数 函 数 , 这 是 因为 它 的 函数 形式 
是 已 知 的 , 而 结 点 个 数 以 及 结 点 的 偏差 和 权重 是 未 知 的 . 等 式 (4.34) 中 从 输入 层 到 
输出 层 的 直接 连接 意味 着 该 网 络 跳 过 了 隐 层 . 我 们 把 这 样 的 网 络 称 为 一 个 跳 过 隐 
层 的 前 馈 网 络 . 

前 馈 网 络 在 神经 网 络 的 文献 中 称 为 多 层 感知 器 (percetrons). 它们 在 紧 集 上 可 
以 通过 增加 隐 层 的 结 点 数目 一 致 逼近 任何 连续 函数 ， 具体 可 参见 Hornik, Stinch- 
combe 和 White (1989); Hornik (1993); Chen 和 Chen (1995). 神经 网 络 的 这 个 性 质 
是 多 层 感 知 器 的 一 般 有 逼近 性 质 . 简 言 之 , 带 有 一 个 隐蔽 层 的 前 馈 神经 网 络 可 以 看 成 
是 一 种 对 一 般 的 连续 非 线 性 函数 参数 化 的 方法 . 
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训练 和 预测 


神经 网 络 的 应 用 包括 两 个 步骤 : 第 一 个 步骤 是 训练 网 络 (例如 去 建立 一 个 网 
络 , 包括 确定 结 点 数目 以 及 估计 它们 的 偏差 和 权重 ); 第 一 个 步骤 是 推断 , 特别 是 预 
W. 在 训练 阶段 数据 通常 被 分 成 两 部 分 不 相 重 登 的 子 样 本 . 第 一 组 于 样本 用 来 估计 
已 知 的 前 馈 神经 网 络 的 参数 ， 第 二 组 子 样本 用 第 一 步 建 立 的 网 络 来 进行 预测 和 计 
算 它 的 预测 精度 . 通过 比较 预测 效果 , 可 以 选 出 比 其 他 效果 好 的 “最 优 ” 网络 来 进 
行 推断 . 这 正 是 在 统计 模型 选择 中 应 用 非常 广泛 的 交叉 验证 法 的 思想 . 也 可 以 利用 
其 他 的 模型 选择 方法 . 

在 一 个 时 间 序 列 的 应 用 中 , 令 {re rlt = 1,… T) 为 网 络 训练 可 利用 的 数据 . 
其 中 x, 表示 输入 值 的 向 量 , 而 r 是 所 关心 的 序列 (比如 一 项 资产 的 对 数 收益 率 )， 
对 于 一 个 给 定 的 网 络 , + o, 为 输入 值 是 x 的 网 络 的 输出 值 , 可 参见 等 式 (4.34). VII 
练 一 个 神经 网 络 相 当 于 选择 它 的 偏差 和 权重 来 最 小 化 某 种 合适 的 标准 , 比如 , 最 小 
二 乘 . 

S? » (ru — o,y?. 
t=] 

这 是 一 个 非 线 性 估计 问题 , “ET AER AE. 为 了 保证 所 拟 合 函数 的 光 
滑 性 , 要 对 前 面 的 最 小 化 问题 加 上 一 些 附加 的 约束 . 在 神经 网 络 文献 中 , 向 后 传播 
(Back Propagation (BP)) 学 习 算法 是 一 种 网 络 训练 的 普遍 方法 . BP 方法 由 Bryson 
和 Ho(1969) 提出 . 它 从 输出 层 开 始 逆向 进行 , 并 且 反 复 用 梯度 规则 来 修正 偏差 和 
权重 . Ripley (1993) 中 的 附录 2A 提供 了 Back Propagation 的 推导 . 一 日 一 个 前 馈 
神经 网 络 建立 , 它 就 能 在 预测 子 样本 中 用 来 计算 预测 了 . 

例 4.7 为 举例 说 明 金 融 中 神经 网 络 的 应 用 , 我 们 考虑 IBM 股票 从 1926 4E 1 月 
到 1999 年 12 月 的 月 对 数 收 益 率 , 以 百分比 形式 给 出 并 且 包括 分 红 . 我 们 把 数据 分 
为 两 组 子 样本 . 第 一 组 子 样本 由 从 1926 年 1 月 到 1997 年 12 月 的 864 个 数据 组 
We. 下 面 用 它 来 建立 模型 . 用 (4.34) 的 带 有 三 个 输入 值 和 含 两 个 结 点 的 隐 层 构成 的 
模型 , 我 们 可 以 得 到 一 个 3-2-1 的 序列 网 络 . 这 三 个 输入 值 分 别 记 为 mauro, 和 
Tra, 偏差 和 权重 由 下 式 给 出 


Tt = 3.22 — 1.81/fi(ri—1) = 2.28 f2(Tt—1) — 0.09T, 1 = 0.05743 = 0.1271 3, (4.35) 


其 中 r1 — (rias re-2, t-a) 两 个 Logistic 函数 是 


exp(—8.34 — 18.97r, 1 + 2.17ry 3 — 19.17r,. 3) 


fini) 7 Y EGp(834— 18977. + 2.1772 — 19.177 3) 


exp(39.25 — 22.17r,., — 17.34r4 2 — 5.98r,..3) 


Tj) 二 一 一 一 一 ~. 
加 re 一 十 exp(39.35 二 22.17rt — 17.3472 — 598r, .3) 
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前 面 模型 的 残 差 标准 误差 是 6.56. 作为 对 照 , 我 们 也 用 同一 数据 建立 AR 模型 , 得 
到 
r,— 1.101 + 0.077r,.1--a,, oo 6.61. (4.36) 
这 个 模型 的 残 差 标准 差 比 式 (4.35) 的 前 馈 神 经 网 络 的 稍微 大 一 点 . 
预测 比较 


1998 年 和 1999 年 的 IBM 股票 的 月 对 数 收 益 率 构 成 了 第 二 组 子 样本 , 用 其 来 
评价 神经 网 络 对 样本 以 外 的 数据 的 预测 效果 . 作为 比较 的 基准 模型 , 我 们 用 第 一 组 
子 样本 的 样本 均值 n. 对 第 二 组 子 样本 的 所 有 月 收益 率 进行 1 步 向 前 预测 ， 这 相 
当 于 假定 IBM 股票 的 月 对 数 价格 服从 一 个 带 漂移 项 的 随机 游 动 模型 . 这 个 基准 模 
型 均 方 预测 误差 (MSFE) 是 91.85. (4.36) 式 的 AR(1) 模型 , 它 的 1 步 向 前 预测 的 
MSFE 是 91.70. 因此 , AR(1) 模型 比 基 准 模型 效果 稍 好 一 点 . 而 (4.35) 式 的 3-2-1 
前 馈 网 络 的 MSE 是 91.74, 与 AR(1) 模型 效果 基本 相同 . 

注释 我 们 用 初始 权重 设 为 缺 省 值 的 S-Plus 程序 来 完成 对 前 馈 网 络 的 估计 . 
要 了 解 更 多 信息 参见 Venables 和 Ripley (1999). 我 们 有 限 的 经 验 表 明 估 计 结 果 是 
变化 的 . 对 例 4.7 中 用 到 的 IBM 股票 收益 率 , 3-2-1 网 络 的 样本 外 数据 的 MSFE 最 
低 可 为 89.46, 最 高 可 到 93.65. 如 果 我 们 改变 隐 层 的 半点 数目 , 则 MSFE 的 变动 范 
国 可 以 更 宽 . 附录 B 给 出 了 例 4.7 中 用 到 的 S-Plus 指令 . 口 
例 4.8 前 馈 网 络 的 优良 特性 包括 其 灵活 性 和 广泛 适用 性 . 举 个 例子 . 我 们 用 一 个 
网 络 , 它 的 输出 层 的 激活 函数 是 Heaviside 函数 , 来 预测 例 4.7 中 考虑 的 IBM rss 
的 价格 变动 方向 . 定义 一 个 指示 变量 

u={ 1 wmRr,>0, 

0, 如 果 rn <0. 
我 们 用 8 个 输入 结 点 和 4 个 隐 层 结 点 建立 一 个 8-4-1 前 馈 网 络 来 预测 第 一 组 子 样 
本 的 di, 其 中 8 个 输入 结 点 是 由 前 4 个 rw 和 的 延迟 值 组 成 的 . 这 个 网 络 用 于 计 
算 在 第 二 组 子 样本 中 的 1 步 向 前 的 向 上 运动 (例如 正 收 益 ) 概率 . 图 4-9 表示 的 是 
一 个 典型 的 概率 预测 的 输出 值 和 第 二 组 子 样本 的 实际 方向 , 后 者 在 图 中 以 no" 标 
tH. 在 图 中 添加 一 条 概率 为 0.5 的 水 平 线 , 如 果 我 们 采用 较为 严格 的 方法 : 当 概 率 
预测 结果 大 于 或 等 于 0.5 时 , 令 d, = 1, 否则 令 d, — 0. 那么 神经 网 络 的 预测 成 功 
率 为 0.58. 当 从 一 个 估计 变 成 另 一 个 时 , 这 个 网 络 的 成 功率 会 显著 改变 , 这 个 网 络 
有 49 个 参数 . 为 了 更 深入 的 理解 , 我 们 做 一 个 模拟 研究 , 将 8-4-1 网 络 运行 500 次 ， 
计算 用 以 前 的 方法 预测 时 向 上 或 向 下 运动 的 出 错 数 目 . 在 这 500 次 中 , 平均 错误 的 
数目 和 错误 的 中 值 分 别 是 11.28 和 11. 错误 最 多 和 最 少 的 数目 分 别 是 18 和 4. 作 
为 对 照 , 我 们 再 用 带 漂移 项 的 随机 游 动 模型 进行 500 次 模拟 预测 , 即 

~ | 1, WẸ a =1.19+e 20, 
0, 否则 ， 
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其 中 1.19 是 IBM 股票 从 1926 年 1 月 到 1997 年 12 月 的 平均 月 对 数 收益 率 , {e} 是 
服从 N(0, 1) 的 独立 随机 变量 序列 . 预测 错误 的 数目 的 平均 值 和 中 位 数 变 为 10.53 
和 11, 而 错误 最 多 和 最 少 的 数目 分 别 是 17 和 5. 图 4-10 是 两 种 模拟 方法 的 预测 出 
错 数目 的 柱状 图 . 结果 表明 对 于 IBM 股票 的 月 对 数 价 格 , 8-4-1 前 馈 神 经 网 络 不 比 
假定 为 一 个 带 漂移 项 的 随机 游 动 的 简单 模型 更 好 . 


1998.5 1999.0 1999.5 2000.0 
H 


4-9 用 s-4-1 前 锁 神 经 网 络 对 IBM 股票 正 的 月 收益 进行 1 步 向 前 概率 预测 . 预测 期 是 从 
1998 年 1 月 到 1999 年 12 H 
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对 IBM 股票 的 月 对 数 收 益 率 的 变动 方向 进行 预测 时 错误 数目 的 柱状 图 . 预测 期 是 从 
1998 年 1 月 到 1999 *F 12 月 
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100 


0 


图 4-10 


4.2 ” 非 线 性 检验 
本 节 讨 论 一 些 在 文献 中 出 现 过 的 非 线性 检验 方法 . 它们 对 4.3 节 中 考虑 的 非 线 
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性 模型 有 很 好 的 功效 . 所 讨论 的 检验 包括 参数 和 非 参数 统计 量 . 平方 残 差 的 Liung- 
Box 统计 , 双 谱 检验 (bispectral test) 和 BDS 检验 都 是 非 参 数 方法 RESET 检验 
(Ramsey, 1969), Tsay(1986,1989) 的 F 检验 , 以 及 其 他 的 拉 格 朗 日 乘 子 法 和 似 然 比 
检验 法 都 依赖 特定 的 参数 函数 . 因为 非 线性 的 情况 有 很 多 , 所 以 检测 非 线性 时 没有 
比 其 他 方法 都 更 好 的 一 种 单独 的 检验 方法 . 


4.2.1 非 参 数 检 验 

在 线性 假设 下 , 一 个 合适 确立 的 线性 模型 的 残 差 应 该 是 独立 的 . 任何 对 残 差 独 
立 性 的 违背 都 说 明了 现 有 模型 包括 线性 的 假设 不 合适 ， 这 就 是 各 种 非 线性 检验 背 
后 的 基本 思想 , 特别 地 , 设计 一 些 非 线性 检验 就 是 用 来 检验 指定 的 时 间 序 列 的 一 次 
形式 可 能 出 现 的 违背 情况 . 

平方 残 差 的 Q- 统计 量 

Mcleod 和 Li(1983) 对 ARMA (p,q) 模型 的 平方 残 差 应 用 Ljung-Box 统计 量 来 
检查 模型 的 不 足 . 这 个 检验 统计 量 是 


m p 


Qim) = 


c=} 


其 中 了 是 样本 容量 , m 是 一 个 恰当 选取 的 在 检验 中 自 相 关 的 数目 , a, 是 残 差 序列 ， 
而 jila?) J& a? 的 i 阶 自 相关 函数 (ACF). 如 果 现 有 的 线性 模型 是 合适 的 , Qm) 应 
该 渐 近 服从 自由 度 为 m — p 一 g 的 x? 分 布 . 就 像 第 3 章 提 到 的 那样 , 前 面 的 Q- 统 
计量 用 来 检测 a 的 条 件 异 方差 性 , 渐 近 等 价 于 Engle 在 1982 年 提出 的 对 ARCH 
模型 的 拉 格 朗 日 乘 子 检验 法 统计 量 , 具体 可 参见 3.4.3 节 . 这 个 统计 量 的 原 假设 是 
Ho : By —---— Bm = 0, 其 中 8 是 下 面 的 线性 回归 的 a?_; 的 系数 : 


= fo + Brai- +++++ mat. + eb, 


其 中 t = m 十 1,… T. 因为 这 个 统计 量 由 残 差 计算 得 到 (而 不 是 直接 观察 到 的 收 
益 率 ), 所 以 自由 度 是 m 一 p 一 gq. 

双 谱 检验 (Bispectral Test) 

该 检验 方法 可 以 用 于 检验 线性 和 正 态 性 . 它 建立 在 这 样 一 个 结果 上 : 线性 时 间 
序列 合适 的 标准 化 的 双 谱 对 所 有 频率 都 是 常数 , TU ELTE TE SENE, 这 个 常数 值 就 是 零 
一 个 时 间 序 列 的 双 谱 是 该 序列 的 三 阶 矩 的 Fourier 变换 . 对 (4.1) 式 的 平稳 时 间 序 
4l zi, 其 三 阶 矩 定义 为 


e(u, v) =g » Vk kcu kv (4.37) 


k=—po 
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AB u 和 w 是 整数 ,g = E(a?), vo = 1, M k<OW yk =0. 对 (4.37) 式 作 Fourier 
变换 , 我 们 得 到 


b3 (ur, w2) = le (wi + we)| r (w1) (we), (4.38) 


Az 2 
其 中 T(w) = $ v, exp(-iwu), Wi i = VAT, wi 是 频率 . zt 的 谱 密度 函数 由 下 式 给 
名 

p(w) = 22 [r(w)P^, 
其 中 w 是 频率 . 从 而 , 函数 变 为 


[ba Qu , we)|? 
b(un,w2) = p(wip(wa)p(w: + wa) = 常数 , 对 所 有 (wi, w2). (4.39) 
双 谱 检验 利用 了 (4.39) 式 的 性 质 . 基本 上 , 我 们 通过 选取 合适 的 格子 点 来 估计 (4.39) 
式 中 的 函数 b(w,, wo) 并 且 用 一 种 类 似 Hotelling 的 T? 统计 量 的 检验 统计 量 来 检 
验 b( uw, wz) 的 常数 性 . 对 一 个 线性 高 斯 序列 , E(a2) = g = 0, 所 以 双 谱 对 所 有 频率 
(w, w2) MBAS. 对 双 谱 检验 的 更 详细 的 讨论 可 参见 Priestley (1988), Subba Rao 
和 Gabr (1984), Hinich (1982). 有 限 的 经 验 表明 当 样 本 容量 很 大 时 , 这 种 检验 法 有 
很 好 的 功效 . 
BDS 统计 量 

Brock, Dechert 和 Scheinkman (1987) 提出 了 一 个 检验 统计 量 ， 通 常 称 之 为 
BDS 检验 . 它 用 来 检测 一 个 时 间 序 列 的 独立 同 分 布 假设 . 这 个 统计 量 不 同 于 其 他 
讨论 过 的 检验 统计 量 , 因为 后 者 主要 集中 在 vy 的 2 阶 或 3 阶 性 质 上 . BDS 检验 法 
PARR AE ERRA “相关 性 求 和 ”. 给 定 一 个 k 维 时 间 

序列 X, 和 观察 值 {X,} 丰 1, 定义 其 相关 性 求 和 为 
Ck(é) = de nm 22 (Xi, Xj), (4.40) 
其 中 (u,v) 是 一 个 示 性 变量 . 当 |u- v|| < 6 时 它 等 于 1, 否则 等 于 0, HF |j 是 
上 确 界 范 数 (supnorm). 相关 性 求 和 度量 了 相距 不 超过 5 的 一 对 数据 {X} 占 所 有 
数据 对 的 比重 . 考虑 下 一 个 时 间 序 列 zx. BE k 维 向 量 Xk = (zt zt meae). 
称 为 大 历史 . BDS 检验 的 思想 如 下 . 把 一 个 大 历史 看 成 上 维 空间 中 的 一 个 点 . 如 果 
{ry} 2, 确实 是 独立 同 分 布 随机 变量 序列 的 话 , 那么 让 历史 OX) Dr, 应 该 在 HS 
间 中 看 不 出 样式 米 . 从 而 , 相关 性 求 和 应 该 满足 关系 Crd) = [Ci (d)|". WRT 
此 式 就 表明 zt 不 是 独立 同 分 布 的 . 举 一 个 简单 而 又 能 说 明 问 题 的 例子 . 考虑 一 列 
独立 同 分 布 的 随机 变量 , 服从 [0,1] 上 的 均匀 分 布 . 4 [a,b] 是 [0,1] 的 子 区 间 , 考虑 2 
历史 (ze 2643), 它 表示 2 维 空间 中 的 一 个 点 . 在 独立 同 分 布 假设 下 , 在 [a,b] x [a,b] 


162 第 4 章 非 线性 模型 及 其 应 用 


中 2 历史 数目 的 期 望 应 该 等 于 [a.b] 中 z, 数目 期 望 的 平方 . 这 个 想法 可 以 用 相关 
性 求 和 对 应 的 样本 进行 正式 的 检验 . 定义 


2 Wha * * 
Ci(0, T) = n1) 2,806 xp), b= 


Hi T =T-l+1. 4 1=1 B} X?—cu0—kHB Xp = XE 在 (n) 是 独 
六 同 分 布 的 并 有 非 退 化 的 分 布 函 数 F(.) 的 原 假 设 下 , Brock, Dechert, Scheinkman 
(1987) 指出 , 对 任意 固定 的 大 和 5 都 有 


Cx(5,T) —[Ci(5)^. (以 概率 工 4 T — o0). 
更 进一步, 统计 量 VT {Ci(5,T) — IC (5, T^ ) 渐 近 于 正 态 分布, 其 均值 为 零 , 方差 
是 


k-1 
cs (à) =4 [v T I». N*-ic2i + (k = E EG ali = enc) r 


j=l 
其 中 c= | [F(z 4-0) — F(z —9)]dF(z), N = | [F(z +46) — F(z —6)|?dF(z). 注意 到 
C1(6,T) 是 C 的 相合 估计 , 而 N 的 相合 估计 可 以 为 


6 
N(6,T) = Th (Tx — 1T — 2) EM Is (Tt, zs)Ts (Ts; Tu). 


于 是 BDS 检验 统计 量 定义 为 
Di(5,T) = VT {Cx(5,7) — (C (5, T) /on (6,7), (4.41) 


其 中 oy. (5,T) 是 在 orld) 中 用 Ci (5, T) 和 IN (5, T) 分 别 代替 C 和 N 时 得 到 的 . 这 
个 检验 统计 量 的 极限 分 布 是 标准 正 态 的 . 应 用 BDS 检验 的 更 多 的 讨论 和 例子 请 见 
Hsich (1989); Brock, Hsieh, LeBaron (1991). 实际 应 用 中 , 在 用 BDS 检验 前 如 果 数 
据 有 线性 相依 性 , 则 我 们 要 去 掉 其 相依 性 . 这 种 检验 对 大 和 5 的 选择 可 能 很 敏感 ， 
BHH k 比较 大 的 时 候 ， 


4.2.2 ”参数 检验 


本 节 将 日 光 转 向 参数 检验 , 考虑 Ramsey 的 RESET 检验 (1969) 以 及 它 的 推 
rV. 我 们 仍然 讨论 一 些 检验 统计 量 米 检测 门限 非 线 性 . 为 简化 记号 , 我 们 在 讨论 中 
使 用 向 量 和 和 矩阵 . 如 果 和 需要 的 话 读 者 可 以 浏览 第 8 章 的 附录 A 简单 复习 一 下 向 量 
各 和 矩阵 的 相关 内 容 . 
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RESET 检验 

Ramsey (1969) 提出 一 种 对 线性 最 小 二 乘 回归 分 析 的 规范 检验 . 称 这 个 检验 为 
RESET 检验 . 它 可 以 很 容易 地 应 用 于 线性 AR 模型 . 考虑 一 个 线性 AR(p) 模型 

ty = X, 1+ a, (4.42) 
其 中 Xii = (breue Zip O= (加 ,和 加) RESET 检验 的 第 一 步 是 获 
得 (4.42) 式 中 的 最 小 二 乘 估计 $, 然后 计算 拟 合 值 2, — X1 10, 残 差 =x, is, 
以 及 残 差 平方 和 SSR = Y ap 其 中 T 是 样本 容量 . 第 二 步 考虑 线性 回归 ; 
t=p+ 


a, = X, 401 $ M; a» + Ut, (4.43) 
其 中 Mi = (22, +++ 87°"), 对 某 个 s > 1, 再 计算 最 小 二 乘 残 差 


以 及 回归 的 残 差 平方 和 SSR = 》 of. RESET 检验 的 基本 思想 是 如 果 (4.42) 
式 的 AR(p) 模型 合适 的 话 , 那么 (4.43) 式 中 的 a 和 as 应 该 为 零 . 这 可 以 通过 一 
般 的 F 统计 量 进行 检验 . (4.43) 式 的 F 统计 量 如 下 : 


| (SSRo — SSRi)/g 
~ SSRT -p - 9) 


在 线性 和 正 态 性 假定 下 , CIRA Á HEE g Al T —p—g h FAA. 

注释 : WA Gf ( 对 大 一 2……,s 十 1) 与 Xei 以 及 它们 自身 之 间 趋 向 于 有 高 
度 相关 性 , 所 以 用 Mei 的 与 Xii 没有 线性 关系 的 主 成 分 对 (4.43) 式 进行 拟 合 . 
主 成 分 分 析 是 一 种 降 维 的 统计 工具 , 参见 第 8 章 的 更 多 内 容 . LI 

Keenan (1985) 提出 了 一 种 对 时 间 序 列 的 非 线性 检验 方法 ， 此 方法 只 用 到 32 
并 且 修 正 了 RESET 检验 法 的 第 二 步 来 回避 22 和 X, , 之 间 的 多 重 共 线 性 (muL 
ticollinearity). 特别 地 , (4.43) 式 的 线性 回归 分 成 两 步 . 在 2(a) 步 , 通过 拟 合 回归 移 
ER 22 p X, , 的 线性 依赖 关系 


其 中 g=s+ptl. (4.44) 


$2 = = eA 18+ Ur. 
f BRAS à, = 22 — X, B. TE 2(b) 2b, 考虑 线性 回归 
at = qa + vw, 
T 


得 到 平方 残 差 和 SSR, — (a — ay? = T i2 来 检验 原 假设 a 二 0. 
t 


一 P 十 t=p+1 
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F 检验 


为 了 改进 Keenan 的 RESET 检验 的 功效 , Tsay (1986) 选择 了 不 同 的 回归 量 
Mia. 特别 地 , 他 建议 使 用 M vech(X, 1X7 4), 其 中 vech(A) 表示 和 矩阵 A 
的 半 拉 直 向 量 , 即 A 对 角 线 及 其 下 面 的 元 素 组 成 的 向 量 , 具体 可 参见 第 8 章 的 附 
录 B. 例如 , 34 p — 2 时， Mica — (x2 4, dicii 2; 22 3). 对 AR(p) RAY, Mi 的 
维 数 是 plp + 1)/2. 在 实际 中 , 这 个 检验 法 就 是 对 如 下 线性 最 小 二 乘 回归 用 普通 偏 
F 统计 量 来 检验 a = 0: 


a = X4 4064 Mijater, 


其 中 ei 是 误差 项 . 在 s, 是 线性 AR(p) 过 程 的 假定 下 , 偏 D 统计 量 服从 一 个 自由 
度 为 g 和 工 -p 一 g 一 1 的 下 分 布 , HP g = plp + 1)/2. 我 们 把 这 种 F 检验 称 为 
Ori-F 检验. Luukkonen, Saikkonen 和 Teräsvirta (1988) 进一步 发 展 了 这 个 检验 法 ， 
将 Ma 增加 到 了 有 三 次 项 r$? i=l, ,p). 

门限 检验 


在 研究 中 , 当 备 择 模型 是 SETAR 模型 时 ,人 们 总 可 以 选 具体 的 检验 统计 量 来 
增加 检验 的 功效 这 些 具 体 的 检验 统计 量 之 一 就 是 似 然 比 统计 量 . 不 过 , 这 个 检验 
遇 到 了 在 线性 的 原 假 设 下 没有 定义 参数 的 困难 , 这 是 因为 对 线性 AR 过 程 门限 是 没 
有 定义 的 . 另 一 种 具体 的 检验 试图 将 检验 门限 非 线性 转化 成 探测 模型 的 变化 . 对 门 
限 非 线性 讨论 这 两 种 方法 的 区 别 很 有 趣 . 

为 简化 讨论 , 让 我 们 考虑 一 个 简单 的 例子 . 备 择 模 型 是 门限 变量 为 w,_4 的 2 
体制 SETAR 模型 . 原 假设 是 Ho: x, 服从 线性 AR(p) 模型 


p 
rt — Qo + * Pir, + Qt, (4.45) 


{=I 


而 备 择 假设 是 Ha: x, 服从 SETAR 模型 


oy” 十 》 op ai Tau 车 t-a<ni, 
T, 三 "à (4.46) 
OD) 十》 Gt? rei + aas, E Piafi 
1—1 
其 中 r 是 门限 . 对 给 定 的 实现 值 (nn)La. 假定 它 是 正 态 的 并 令 lolh a?) 为 对 
数 似 然 函数 ， 它 是 以 o = (boop) 和 o2 的 最 大 似 然 估计 计算 得 到 的 .这 
很 容易 计算 . 如 果 给 定 门 限 ri, 那么 在 备 择 条 件 下 似 然 函数 也 是 易于 计算 的 ， 令 
ly (1-13 by, O25 bo. 3) 为 对 数 似 然 函 数 , 它 是 在 知道 门限 ri 的 条 件 下 , 由 内 = (00, 
o Y 和 o2 的 最 大 似 然 估计 计算 得 到 的 . 对 数 似 然 比 定义 为 


Uri) = li(rii 1,67; G2: 63) — lolh, ĉa). 
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它 是 未 知 门限 r 的 函数 . 然而 在 原 假设 下 , 并 没有 门限 而 且 rn 没有 定义 . 在 原 假设 
下 参数 ry 称 为 讨厌 参数 (nuisance parameter). 因此 似 然 比 的 渐 近 分 布 与 通常 的 似 
然 比 统计 量 有 很 大 不 同 . 可 以 参见 Chen (1991) 以 获得 更 多 的 细节 和 这 个 检验 的 临 
界 值 (critical value). 一 个 通常 的 做 法 是 取 sax = SUD, <n, u Llr) 作为 检验 统计 量 ， 
其 中 vw 和 是 事先 指定 为 门限 的 下 界 和 上 界 . Davis (1987), Andrews 和 Ploberger 
(1994) 更 进一步 地 讨论 了 原 假 设 下 含 讨厌 参数 的 假设 检验 .模拟 法 经 常用 于 获取 
检验 统计 量 lmas 的 经 验 临 界 值 , 而 Linas KF o A u REFE. (ri) 在 m 6 [wu] 
上 的 平均 值 也 被 Andrews 和 Ploberger 考虑 作为 检验 统计 量 . 

Tsay (1989) 利用 排序 自 回归 (arranged autoregression) 和 递归 估计 得 到 另外 一 
个 门限 非 线 性 的 检验 . 在 备 择 假设 Ha F, 排序 自 回 归 试 图 将 SETAR 模型 问题 转 
变 成 一 个 模型 改变 问题 , 其 改变 点 就 是 门限 ory. 为 说 明 这 点 , (4.46) 式 的 SETAR 模 
型 是 说 x, 实质 上 服从 两 个 线性 模型 , 分 别 依赖 于 cea < ri 或 zi_a 2 r 对 实现 
值 (ras se-a 取 值 {z1,… ,zr_a}. > Ta) S Tia) S -+ S Tr_d) 为 (na HE 
列 好 的 数据 (比如 将 这 些 观 测 值 技 递 增 的 顺序 排 好 ). 这 样 SETAR 模型 可 写成 


p 
rGy4a = Bot > BiTyjyd-i tagja j=l, T — d, (4.47) 
其 中 当 ro) «n 时 5, — 9f, 4 xy) >r 时 8; = 907. 从 而 , 门限 是 (4.47) 式 
线性 回归 的 改变 点 , 我 们 称 (4.47) 式 为 排序 自 回归 (门限 riea 是 递增 顺序 的 ). 注 
意 到 (4.47) 式 的 排序 自 回归 并 没 改 变 zi 对 m i08 i = 1,:… ,p) 的 动态 依赖 性 , 这 
是 因为 roja 仍然 依赖 于 m4 08 i= 1,… ,p). 上 面 完 成 了 将 SETAR 模型 放 
到 门限 空间 中 以 代替 时 间 空 间 . 这 就 是 说 , 带 有 较 小 的 rz，_u 的 式 子 会 出 现在 带 有 
BK oa 的 式 子 之 前 . Tsay (1989) 的 门限 检验 如 下 . 
Bids 用 j=1,…,m WA (4.47) 式 , 其 中 m 是 事先 指定 的 正 整 数 (比如 
30). 记 3; 的 最 小 二 乘 估 计 是 后 ,其 中 m 表示 用 于 估计 的 数据 点 个 数 . 
第 2 步 计算 预测 残 差 


Gem+1)td = Lim 41) +d — Bown = 3 B mT(na1)42-4 
i=] 
和 它 的 标准 误差 . 令 am soa 为 标准 化 的 预测 残 差 . 
第 3 步 用 递归 最 小 二 乘法 去 修正 最 小 二 乘 估计 ma, 它 是 通过 合并 新 数 
据点 T(m--1)4-d 实现 . 
第 4 步 重复 第 2, 3 步 , 直至 所 有 数据 点 都 处 理 过 . 
第 5 步 考虑 标准 化 的 预测 残 差 的 线性 回归 


p 
É(m--j)t-d = Oo 十 >P Tim jjtd-i + ve J=1,---,T—d—m, (4.48) 


i=1 
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并 计算 通常 的 FF 统计 量 以 检验 (4.48) 式 中 的 ai = 0(i = 0,--- p). 在 z, 服从 线性 
AR(p) 模型 的 原 假设 下 , F 比率 的 极限 分 布 是 一 个 自由 度 为 p+1 和 了 一 d 一 叹 一 
的 下 分 布 . 

我 们 称 上 面 的 FF 检验 为 TAR-F 检验 . 这 个 检验 背后 的 思想 是 , 在 原 假设 下 
(4.47) 式 的 排序 自 回 归 中 没有 模型 改变 , 所 以 标准 化 的 预测 残 差 应 该 接近 均值 为 0、 
方差 为 1 的 独立 同 分 布 的 随机 变量 . 在 这 种 情况 下 , 那些 标准 化 的 预测 残 差 应 该 与 
同 归 值 cosas 不 相关 . 要 了 解 更 多 关于 递归 最 小 二 乘法 和 TAR-F 检验 表现 的 
模拟 研究 的 细节 , 请 参见 Tsay (1989). TAR-F 检验 回避 了 似 然 比 检验 中 过 到 的 讨 
厌 参数 问题 . 它 不 要 求知 道门 限 n 并 且 只 是 简单 地 检验 了 在 原 假设 下 预测 残 差 与 
回归 值 的 不 相关 性 .因此 , 这 个 检验 不 依赖 于 一 定 要 知道 备 择 模型 中 体制 的 数目 . 
但 是 如 果真 实 模型 确实 是 有 已 知 更 新 分 布 的 2 体制 SETAR 模型 , 那么 TAR-F E 
验 的 功效 不 如 似 然 比 检验 . 


4.2.3 ”应 用 


本 节 把 先前 讨论 的 一 些 非 线性 检验 应 用 到 5 个 时 间 序 列 中 . 对 一 个 真实 的 金 
融 时 间 序 列 , 一 般 用 AR 模型 移 除 数据 中 的 相关 成 分 , 然后 将 检验 用 到 模型 的 残 差 
序列 中 . 这 5 个 序列 如 下 . 

(1) rag: 500 个 观测 值 组 成 的 独立 同 分 布 的 、 服 从 N (0,1). 的 模拟 序列 . 

(2) ror: 独立 同 分 布 的 ,服从 自由 度 为 6 的 t 分布 的 模拟 序列 , 样本 容量 是 500. 

(3) azı: 1926 年 到 1997 年 的 CRSP 等 权重 指数 月 对 数 收益 率 的 864 个 观测 值 
的 残 差 序 列 . 用 到 的 线性 AR 模型 是 


(1 — 0.180B + 0.099B* 一 0.105B9)rat = 0.008 6 + ast- 


(4) ay: 1926 年 到 1997 年 的 CRSP 的 价值 加 权 指 数 月 对 数 收益 率 的 864 个 观 
测 值 的 残 差 序列 . 用 到 的 线性 AR 模型 是 


(1 — 0.098B + 0.111 B°? — 0.088B®)rat = 0.007 8 + age. 


(5) ase: 1926 年 到 1997 年 的 IBM 股票 月 对 数 收益 率 的 864 个 观测 值 的 残 差 
序列 . 用 到 的 线性 AR 模型 是 


(1 — 0.077B)rg, = 0.011 + ag,. 


dk 4-2 是 非 线性 检验 的 结果 . 对 模拟 序列 和 IBM 收益 率 , 已 检验 是 建立 在 AR(G) 
模型 的 基础 上 的 . 对 指数 收益 率 , AR 的 阶 与 前 面 的 模型 一 样 . 对 BDS 检验 , 我 们 
选择 6 二 6, 和 5= Da k W2, ,5. 表 中 还 给 出 了 Ljung-Box 统计 量 以 确定 在 
应 用 非 线性 检验 前 残 差 序列 没有 序列 相关 性 . 与 它们 的 渐 近 临界 值 比较 , BDS 检验 
和 F 检验 对 模拟 序列 在 5 多 的 水 平 下 是 不 显著 的 . 不 过 对 真实 的 金融 时 间 序 列 而 
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ilk 


, BDS 检验 却 是 高 度 显著 的 . F 检验 对 指数 收益 率 也 显示 出 了 显著 的 结果 , 但 它 
们 没有 检验 出 IBM 对 数 收 益 率 的 非 线性 . 总 之 , 这 些 检验 证 明了 模拟 序列 是 线性 
的 并 认为 股票 收益 率 是 非 线性 的 . 


He 4-2 ”对 模拟 序列 和 一 些 股票 对 数 收益 率 的 非 线 性 检验 “ 
数据 Q Q BDS (5 二 1.56o) 


In(ew) 
In(vw) 
In(ibm) 


a 模拟 序列 的 样本 容量 是 500, 股票 收益 率 的 样本 容量 是 864. BDS 检验 用 上 大 一 2,…… ,5. 


4.3 x Hs 


非 线性 时 间 序 列 的 建 模 必须 包含 一 些 主观 判断 . 不 过 , 仍然 要 遵守 一 些 总 体 上 
的 准则 , 非 线 性 检验 开始 时 要 建立 在 一 个 合适 的 线性 模型 的 基础 上 ， 对 金融 时 间 
序列 , Liung-Box 统计 量 和 Engle 检验 通常 用 于 检测 条 件 异 方差 性 ， 对 一 般 序列 ， 
可 以 用 4.2 节 的 其 他 检验 法 ， 如 果 非 线性 在 统计 上 是 显著 的 , 那么 可 选择 接受 一 
类 非 线性 模型 .这 种 选择 可 能 依赖 分 析 者 的 经 验 和 研究 问题 的 实质 ， 对 于 波动 率 
BUS. ARCH 过 程 的 阶 是 通过 检查 平方 序列 的 偏 自 相 关 函 数 确定 的 ， 对 GARCH 
和 EGARCH 模型 , 在 绝 大 多 数 应 用 中 , 只 考虑 如 同 (1,1), (1,2) 和 (2,1) 低 阶 的 情 
况 ， 更 高 阶 的 模型 很 难 估计 和 理解 . 对 TAR 模型 , 可 以 用 Tong (1990) 和 Tsay 
(1989,1998) 给 出 的 步骤 程序 建立 合适 的 模型 . 当 样 本 容量 充分 大 时 , 可 以 用 非 线性 
技术 去 探测 数据 的 非 线 性 因素 , 然后 据 此 选择 合适 的 非 线性 模型 . 具体 可 见 Chen 
和 Tsay (1993a) 以 及 Cai, Fan 和 Yao(2000). Lewis 和 Stevens(1991) 的 MARS f& 
序 也 可 以 用 来 探测 数据 的 动态 结构 . 最 后 , 像 Akaike 信息 准则 (Akaike,1974) 这 样 
的 信息 标准 以 及 广义 机 会 比 (Chen, McCulloch 和 Tsay (1997)) 可 以 用 来 区 分 候选 
的 非 线性 模型 . 选 定 的 模型 在 被 用 来 预测 前 应 该 仔细 检查 核对 . 


44 fh 测 
与 线性 模型 不 同 , 当 预 测 长 度 大 于 1 时 , 对 绝 大 多 数 非 线性 模型 , 计算 其 预测 
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值 并 没有 显示 表达 公式 . 我 们 用 参数 自助 (parameric bootstraps) 法 计算 非 线 性 预 
测 值 . 我 们 很 容易 理解 , 模型 在 用 于 预测 前 需要 严格 的 检查 以 判断 对 所 研究 的 序列 
是 否 合适 . 通过 一 个 模型 , 我 们 可 以 了 解 动态 结构 和 新 息 分 布 . 在 某 些 情况 下 , 我 们 
可 以 把 估计 的 参数 看 作 已 知 的 . 


4.4.4 ”参数 自助 法 


4 T 为 预测 原点 , | 为 预测 步 长 (1 > 0). 这 就 是 说 , 我 们 处 在 时 间 指 标 T 处 
并 对 预测 op), 感 兴 趣 ， 参数 自助 法 计算 实现 值 x7 1,… ery, 依次 通过 下 面 步 
DR: (a) 从 模型 指定 的 新 息 分 布 中 重新 抽取 一 个 新 的 新 息 ; (b) 用 模型 、 数 据 以 及 以 
前 的 预测 TT-1:7^77 一 计算 UT +i: 这 样 得 到 LT 二 的 一 个 实现 值 . 重复 这 个 过 


程 M 次 来 得 到 sry 的 M 个 实现 值 , 并 用 {afa} RR. eru 的 预测 点 就 取 
z 风 ,的 样本 均值. 令 预测 为 zz(1). 在 一 些 应 用 中 我 们 取 M = 3 000, 并 且 结 果 证 明 
效果 不 错 . 实现 值 oP), } 也 可 用 于 获得 ora 的 经 验 分 布 . 我 们 稍 后 利用 经 验 
分 布 去 评估 预测 功效 

4.4.2 ”预测 的 评估 


评估 模型 的 预测 功效 有 很 多 方法 , 从 方向 度量 到 大 小 度量 再 到 分 布 度量 . 73 18] 
上 度量 考虑 由 模型 可 推 知 的 将 来 的 变动 方向 (上 升 或 下 降 ). 预测 明 大 的 S&P 500 指 
数 将 楼 上 升 或 下 降 是 一 个 有 实际 意义 的 方向 预测 的 例子 ,预测 年 终日 S&P 500 指 
数 的 价值 属于 大 小 度量 的 例子 . 最 后 , 评估 从 现在 到 年 终 的 日 S&P 500 指数 将 上 升 
10% 或 更 多 的 可 能 性 要 求知 道 将 来 该 指数 的 条 件 概 率 分 布 . 而 评估 这 样 一 个 估价 的 
精度 则 需要 分 布 度量 . 

在 实际 中 , 可 利用 的 数据 集 被 分 成 两 部 分 子 样本 . 第 一 部 分 子 样本 的 数据 用 来 
建立 一 个 非 线 性 模型 ; 第 二 部 分 子 样本 用 来 评估 模型 的 预测 功效 . 我 们 称 这 两 部 分 
子 样本 分 别 为 估计 子 样本 和 预测 子 样本 . 在 一 些 研究 中 , 常 使 用 滚动 预测 程序 . 当 
预测 原点 前 进 时 , 一 个 新 的 数据 点 从 预测 子 样本 转移 到 估计 子 样本 中 . 下 面 我 们 将 
简要 地 讨论 文献 中 一 些 通常 用 到 的 预测 功效 的 度量 方法 . 不 过 要 记 住 的 是 在 比较 
模型 优 劣 时 不 存在 单独 地 被 广泛 接受 的 度量 方法 . 为 了 更 好 地 了 解 这 种 比较 , 可 能 
需要 一 个 基于 预测 目的 的 效用 函数 . 


方向 度量 


一 个 典型 的 度量 法 是 用 一 个 2 x 2 的 列 联 表 来 总 结 在 预测 子 样本 中 预测 er, 
上 升 和 下 降 的 相对 应 的 模型 的 “ 击 中 ”(hit) M “ER” (misse) 数目 . 具体 说 来 , 列 
联 表 如 下 给 出 


其 中 m 是 预测 子 样本 中 1 步 向 前 预测 的 总 数目 . maa 是 预测 向 上 运动 昌 击 中 (预测 
正确 ) 的 数目 , ma 是 预测 市 场 向 下 运动 日 丢失 (预测 错误 ) 的 数目 , 依次 类 推 . mi 
和 mo 有 较 人 值 意味 着 较 好 的 预测 . 其 检验 统计 量 


mi ees y 


(mij 一 
- i aT 


可 以 用 来 评估 这 个 模型 的 功效 . 大 的 x? 值 表示 该 模型 优 于 随机 选择 的 机 会 . 在 一 
些 适度 的 条 件 卜 , x? 渐 近 服从 自由 度 为 1 的 x? 分 布 . 有 关 这 种 度量 的 更 进一步 讨 
i£ V, Dahl 和 Hylleberg(1999). 

作为 方向 度量 的 例子 , 考虑 图 4-9 中 的 8-4-1 前 馈 神 经 网 络 的 1 步 向 前 概率 预 
测 . 这 个 网 络 的 击 中 和 丢失 的 2 x 2 表格 是 


这 个 表 显 示 了 该 网 络 对 向 上 运动 的 预测 不 错 , 但 对 股票 向 下 运动 的 预测 不 理想 . 这 
个 表格 的 x? 统计 量 是 0.137, p 值 是 0.71. 从 而 , 网 络 并 没有 显著 地 优 于 一 个 对 向 
上 向 下 等 概率 的 随机 游 动 模型 

大 小 度量 


有 3 个 统计 量 经 常用 于 度量 点 预测 的 功效 . 它们 是 均 方 误差 (MSE) 平均 绝 
对 偏差 (MAD) 和 平均 绝对 百分比 误差 (MAPE). 对 1 步 向 前 预测 , 这 些 度量 定义 
如 下 


m.—1 


^ 1 
MSE(!) = — 5 [errs — ers (0), (4.49) 
j=0 


m—i 
MAD(I) = — 97 |zr«iej — 2r3()], (4.50) 


1 m-—1 
MAPE(l) = — 
各 
其 中 m 是 预测 子 样本 中 可 用 于 ! 步 向 前 预测 的 数目 . 在 应 用 中 , 人 们 通常 选择 上 
面 3 种 度量 之 一 . 这 种 度量 取 值 最 小 的 模型 被 认为 是 最 好 的 1 步 向 前 预测 模型 . 1 


srl) — ! 


4.51 
CT +541 ( ) 
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的 不 同 可 能 会 导致 选用 不 同 的 模型 ， 这 些 度量 在 模型 对 比 中 仍然 有 其 他 的 局 限 性 . 
具体 可 参见 诸如 Clements 和 Hendry (1993) 的 文献 . 


分 布 度量 


从 业 人 员 最 近 开 始 用 预测 分 布 来 对 一 个 模型 的 预测 功效 进行 评估 . 严格 来 讲 ， 
预测 分 布 融 合 了 预测 时 参数 的 不 人 确定 性 . 如 果 参 数 可 看 作 固 定 的 话 , 我 们 就 称 它 为 
条 件 预 测 分 布 . 通过 参数 自助 法 得 到 的 zzr+ 的 经 验 分 布 是 一 个 条 件 预测 分 布 . 这 
个 经 验 分 布 通常 用 于 计算 分 布 度量 , 令 url) 为 观测 值 cre 在 前 面 所 述 经验 分 布 
中 的 分 位 数 . 我 们 有 一 个 m 个 分 位 数 (ur; (0) 7-9. 的 集合 , 其 中 m 是 预测 子 样 
本 中 ! 步 向 前 预测 的 数目 . 如 果 接 受 的 模型 合适 的 话 , (uris (0) 应 该 是 服从 [0,1] 
上 均匀 分 布 的 一 个 随机 样本 . 对 一 个 充分 大 的 m, 可 以 计算 服从 [0,1] 上 均匀 分 布 
的 (ur. ;(0)) 的 Kolmogorov-Smirnov 统计 量 . 这 个 统计 量 可 用 于 模型 的 检验 和 预 
测 的 比较 . 


4.5 应 用 


本 节 通 过 分 析 1948 年 到 1993 年 经 季节 调整 后 的 每 季度 美国 平民 失业 率 来 说 
明 非 线性 时 间 序 列 模 型 . Montgomery, Zarnowitz, Tsay 和 Tiao (1998) 详细 地 分 析 
过 这 个 序列 . 这 里 我 们 用 非 线 性 模型 重复 他 们 的 一 些 分 析 内 容 . 图 4-11 是 数据 的 
时 间 图 . 这 个 序列 明显 的 特征 包括 : (a) 倾向 于 与 美国 商业 周期 相反 周期 性 ; (b) 失 
业 率 上 升 时 很 快 , 下 降 时 却 很 慢 . (b) 特征 说 明 该 序列 的 动态 结构 是 非 线 性 的 . 


10 


1950 1960 1970 1980 1990 
年 


图 4-11 从 1948 年 到 1993 年 每 季度 美国 失业 率 (经 季度 调整 后 ) 的 时 间 图 


记 该 序列 为 x, 并 且 令 Az = ze 一 zt_i 为 失业 率 的 变动 值 . Montgomery 等 人 
(1998) 建立 了 线性 模型 


(1 —0.31B*)(1 —0.65B)Aa, = (1 —0.78B*)a,, 62 = 0.090, (4.52) 
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其 中 三 个 系数 的 标准 差分 别 为 0.11,0.06 和 0.07. 虽然 数据 经 过 了 季节 调整 , 但 模型 
还 是 呈现 了 季节 性 . 这 说 明 季 节 调 整 并 没有 成 功 地 移 除 季 节 性 . 我 们 把 这 个 模型 当 
作 预 测 比较 的 基准 模型 . 

为 检验 非 线 性 , 我 们 对 由 差分 序列 Az, 建立 的 AR(5) 模型 进行 4.2 节 中 介绍 
过 的 一 些 非 线 性 检验 . 结果 在 表 4-3 中 给 出 . 所 有 的 检验 法 都 拒绝 了 线性 假设 . SE 
际 上 , 已 经 拒绝 了 所 有 使 用 AR(p)( 其 中 p = 2,--- ,10) 模型 的 线性 假设 . 


表 4-3 1948 年 第 二 季度 到 1993 年 第 四 季度 的 美国 季度 失业 率 变化 的 非 线性 检验 * 


类 型 Ori-F LST TAR(1) TAR(2) TAR(3) TAR(4) 
检验 2.80 2.83 2.41 2.16 2.84 2.98 
p tt 0.000 7 0.000 2 0.029 8 0.050 0 0.012 1 0.008 8 
a 使 用 AR(5) 模型 , LST 表示 Luukkonen 等 人 (1988) 提出 的 检验 , TAR(d) 指 的 是 延迟 为 d 的 门 
限 检验 . 


用 类 似 于 Tsay (1989) 的 建 模 程序 , Montgomery 等 人 (1998) 对 Ar, FIE 
了 下 面 的 TAR BUS: 


dances 0.014-0.73^2, 4 --0.10Az, 2-- ai, WME Ara € 0.1, 
à 0.184-0.80A2; i —0.56Az, 2 | ag, ASM. 


ai, 和 as, 的 样本 方差 分 别 是 0.76 和 0.165, 体制 1 的 三 个 系数 的 标准 差分 别 是 
0.03, 0.10 和 0.12; 体制 2 的 三 个 系数 的 标准 差 则 分 别 是 0.09, 0.1 和 0.16. 这 个 模 
型 说 明了 美国 季度 失业 率 的 变化 值 Ar, 在 zs 一 zt_s 的 门限 为 0.1 的 基准 空间 中 
很 像 一 个 分 段 线性 模型 . 直观 上 , 该 模型 暗示 了 随 着 最 近 失 业 率 的 改变 失业 人 数 的 
表现 是 不 同 的 . 在 第 一 个 体制 下 , 失业 率 下 降 或 有 轻微 的 上 升 . 这 样 经 济 应 该 是 稳 
定 的 . 实质 上 变动 率 服从 一 个 简单 的 AR(1) 模型 , 因为 2 阶 延 迟 系数 是 不 显著 的 . 
在 第 二 个 体制 下 , 失业 率 (0.1 或 更 大 ) 有 一 个 大 幅 跳跃 . 这 典型 地 与 经 济 周期 的 紧 
缩 期 相对 应 . 而 且 这 个 时 期 可 能 发 生 政府 干预 经 济 以 及 产业 结构 调整 . 这 里 As, 服 
从 一 个 带 正常 数 项 的 AR(2) 模型 , 显示 了 c, 向 上 的 趋势 . 这 个 AR(2) 多 项 式 有 两 
个 复 特征 根 , 显示 了 Ac. 可 能 的 周期 行为 . 从 而 , c, 出 现 转 折 点 的 可 能 性 增 大 , 意 
味 着 m, 大 幅 增长 的 时 期 会 很 短 . 这 意味 着 美国 经 济 的 紧缩 期 比 扩 张 期 要 短 些 . 

Montgomery 等 人 (1998) 用 马尔 可 夫 链 蒙特 卡 罗 (Markov Chain Monte Carlo) 
方法 得 到 下 面 关 于 Az, 的 马尔 可 夫 转 换 模型 


Ag 一】」-007+0.38Axt-i 一 0.05Azrt-2 十 sit， WR s, — 1, 
o | 016--0.86Az, li 一 038Az_z+esat， 如 果 s — 2. 


Ax, 的 条 件 均值 当 s, = 1 时 是 -0.10, 当 s = 2 时 是 0.31. 从 而 , 第 一 个 状态 表示 
经 济 的 扩张 期 , 第 二 个 状态 表示 经 济 的 紧缩 期 . e1: 和 cn, 的 样本 方差 分 别 是 0.031 
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和 0.192. 在 状态 s, = 1 时 , 三 个 参数 的 标准 差分 别 是 0.03, 0.14 和 0.11, 而 在 状态 
s, = 2 时 , 它们 则 分 别 是 0.04, 0.13 和 0.14. 状态 转移 概率 是 Pls = 2|s1 = 1) = 
0.084(0.060) 和 P(s, = 1|s..: = 2) = 0.126(0.053), 其 中 括号 里 的 数字 是 对 应 的 标 
准 误差 . 这 个 模型 说 明 在 第 二 个 状态 下 , 当 AR(2) 多 项 式 有 复 特 征 根 时 , 失业 率 r 
有 向 上 的 趋势 . 模型 的 这 个 特征 很 像 (4.53) 式 的 第 2 个 体制 的 TAR 模型 . 在 第 一 
个 状态 下 , 失业 率 n 有 带 弱 得 多 的 自问 归结 构 的 轻微 的 下 降 趋 势 . 

预测 功效 


Montgomery 等 人 (1998) 用 一 个 滚动 程序 预测 失业 率 xz. 该 程序 如 下 . 

(1) 以 了 = 83 为 预测 原点 , 该 点 对 应 于 1968. ll. 它 在 文献 中 用 于 监视 各 种 预 
测 失业 率 的 模型 的 功效 . 用 从 1948. | 到 预测 原点 (包括 预测 原点 ) 的 数据 估计 线 
性 、TAR 和 MSA 模型 . 

(2) 进行 1 季度 和 5 季度 的 向 前 预测 并 计算 每 个 模型 的 预测 误差 . 对 非 线 性 模 
型 的 预测 使 用 4.4 节 中 的 参数 自助 法 . 

(3) 预测 原点 向 前 移 1 步 , 然后 重复 估计 和 预测 过 程 , 直到 每 个 数据 都 使 用 过 . 

(4) 用 MSE 和 平均 预测 误差 来 比较 模型 的 功效 . 

从 表 4-4 可 以 看 到 (4.52) 式 的 线性 模型 (4.54) 式 的 TAR 模型 和 (4.54) 式 的 
MSA 模型 预测 的 相对 MSE 和 平均 预测 误差 . 此 处 用 线性 模型 作为 基准 . 比较 是 基 
于 总 体 表现 和 在 预测 原点 美国 的 经 济 状况 . 从 这 张 表 格 中 , 我 们 观察 到 下 面 的 结论 . 

(1) 总 体 上 比较 , TAR 模型 和 线性 模型 的 MSE 非常 接近 , 但 TAR 模型 的 偏差 
更 小 . 而 MSA 模型 有 最 大 的 MSE 和 最 小 的 偏差 . 

(2) 当 预 测 原点 在 经 济 紧缩 期 时 , TAR 模型 无 论 是 MSE 还 是 偏差 都 比 线性 模 
型 表现 得 要 好 . MSA 模型 也 比 线性 模型 好 , 但 没有 TAR 模型 好 得 那么 多 . 

(3) 当 预 测 诛 点 在 经 济 扩张 期 时 , 线性 模型 比 两 个 非 线 性 模型 要 好 . 

结果 表明 了 当 美国 经 济 处 于 紧缩 期 时 , 在 预测 美国 季度 失业 率 上 非 线性 模型 的 
表现 超过 线性 模型 . 这 并 不 奇怪 , 因为 就 像 前 面 提 到 的 , 在 经 济 紧缩 时 政府 会 干预 
经 济 并 且 会 进行 产业 结构 调整 . 这 些 外 部 事件 引起 了 美国 失业 率 的 非 线 性 ， 直观 
上 , 这 样 的 改进 很 重要 , 因为 在 经 济 紧缩 期 , 人 们 会 更 关注 经 济 预测 . 


#444 对 美国 季度 失业 率 用 线性 .TAR 和 MSA 模型 的 样本 外 预测 的 比较 = 


模型 预测 的 相对 MSE 
1 步 2 步 3 步 A p 5H 
总 体 比 较 
线性 1.00 1.00 1.00 1.00 1.00 
TAR 1.00 1.04 0.99 0.98 1.03 
MSA 1.19 1.39 1.40 1.45 1.61 


MSE 0.08 0.31 0.67 1,13 1.54 
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( 续 ) 
模型 预测 的 相对 MSE 
i 13b 2 步 34 4 5 步 
经 济 紧缩 时 的 预测 原点 
线性 1.00 1.00 1.00 1.00 1.00 
TAR 0.85 0.91 0.83 0.72 0.72 
MSA 0.97 1.03 0.96 0.86 1.02 
MSE 0.22 0.97 2.14 3.38 3.46 
经 济 扩 张 时 的 预测 原点 
线性 1.00 1.00 1.00 1.00 1.00 
TAR 1.16 1.13 pS 1.15 1.17 
MSA 1.31 1.64 1.73 1.84 1.87 
MSE 0.06 0.21 0.45 0.78 1.24 
预测 误差 的 均值 — 
总 体 比较 
线性 0.03 0.09 0.17 0.25 0.33 
TAR 0.10 -0.02 -0.03 0.03 -0.01 
MSA 0.00 0.02 -0.04 -0.07 -0.12 
经 济 紧缩 时 的 预测 原点 
线性 0.31 0.68 1.08 1.41 1.38 
TAR 0.24 0.56 0.87 1.01 0.86 
MSA 0.20 0.41 0.57 U.52 0.14 
经 济 扩张 时 的 预测 原点 
线性 0.01 0.00 0.03 0.08 0.17 
TAR -0.05 0.11 -0.17 -0.19 -0.14 
MSA -0.03 -0.08 -0.13 0.17 -0.16 


a 预测 原点 是 1968 年 第 2 季度 . 用 “MSE” 标记 的 行 表示 基准 线性 模型 的 MSE( 均 方 误差 ). 
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用 于 给 IBM 股票 日 对 数 收 益 率 建立 AR(2)-TAR-GARCH(1,1) 模型 
数据 文件 是 d-ibmln03.txt. 


all 0 10446:1 
open data d-ibmln03.txt 
data(org-obs) / rt 
set h = 0.0 
nonlin mu p2 a0 al bl a2 b2 
frml at = rt(t)-mu-p2*rt (t-2) 
frml gvar = a0 + al*at(t-1)**22sbl*h(t-1) $ 
+ Sif(at(t-1) < 0,a2*at(t-1)**2«b2*h(t-1),0) 
frml garchln = -0.5*1log(h(t)sgvar(t))-0.5*at(t)**2/h(t) 
smpl 4 10446 
compute mu 
compute a0 


0.03, p2 - -0.03 
0.07, al = 0.05, a2 = 0.05, bi = 0.85, b2 = 0.05 
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maximize (method=simplex,iterations=10) garchln 

smpl 4 10446 

maximize (method=bhhh, recursive, iterations=150) garchln 
set fv = gvar(t) 

set resid = at(t)/sqrt(fv(t)) 

set residsq = resid(t) *resid(t) 

cor (qstats,number=20,span=10) resid 

cor (qstats,number=20,span=10) residsq 


用 于 给 3M 股票 月 简单 收益 率 建 立 一 个 平滑 的 TAR 模型 
数据 文件 是 和 -mmm .txt，. 


all 0 623:1 
open data m-mmm.txt 
data(org=obs) / mmm 


set h = 0.0 

nonlin a0 al a2 a00 all mu 

frml at = mmm(t) - mu 

frml vari = a0+al*at(t-1) **2+a2*at (t-2) **2 


frml Var2 = a00-«all*at(t-1)**2 
frml gvar = varl(t)+var2(t)/(1.0+exp(-at(t-1)*1000.0)) 
frml garchlog = -0.5*log(h(t) =qvar(t))-0.5*at (t) **2/h(t) 


smpl 3 623 
compute 80 = .01, al = 0.2,.82 = 0.1 
compute a00 = .01, all = -.2, mu = 0.02 


maximize (method=bhhh, recursive,iterations=150) garchlog 
set fv = gvar(t) 

set resid - at(t)/sqrt(fv(t)) 

set residsq - resid(t)*resid(t) 

cor (qstats,number=20,span=10) resid 

cor (qstats,number=20,span=10) residsq 


附录 B 神经 网 络 的 S-Plus 命令 


以 下 S-Plus 命令 是 用 来 建立 例 4.7 中 的 3-2-1 跳跃 层 的 前 馈 网 络 . "p “we 号 
的 行 是 注释 . 数据 文件 是 ‘rm-ibmln.txt?. 


# load the data into S-Plus workspace. 

x scan(file-'m-ibmln.txt') 

# select the output: r(t) 

y x[4:864] 

# obtain the input variables: r(t-1), r(t-2), and r(t-3) 
ibm.x cbind(x[3:863],x[2:862] ,x[1:861] ) 

# build a 3-2-1 network with skip layer connections 

# and linear output. 

ibm.nn_nnet (ibm.x,y,size=2, linout=T,skip=T,maxit=10000, 
decay-le-2,reltol-1e-7,abstol-1le-7,range-1.0) 

4 print the summary results of the network 

summary (ibm.nn) 

# compute \& print the residual sum of squares. 
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sse sum((y-predict (ibm.nn, ibm.x) ) *2) 

print (sse) 

#eigen (nnet .Hess (ibm.nn,ibm.x,y),T)$values 

# setup the input variables in the forecasting subsample 
ibm.p cbind(x[864:887],x[863:886],x[862:885]) 

4 compute the forecasts 

yh predict (ibm.nn, ibm.p) 

# The observed returns in the forecasting subsample 

yo x[865:888] 

# compute \& print the sum of squares of forecast errors 
ssfe sum((yo-yh)^2) 

print (ssfe) 

# quit S-Plus 

qt) 
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4.1 考虑 约翰 兄弟 公司 股票 从 1990 年 1 月 到 2003 年 12 月 的 日 简单 收益 率 , 数据 放 在 文件 
d-jnj9003.txt 中 , 也 可 以 从 CRSP 得 到 . 把 收益 率 转化 为 对 数 收益 率 , 并 以 百分比 形式 
给 出 . 

(a) 给 对 数 收益 率 序列 建立 一 个 GIR BUS, 并 写 下 所 拟 合 的 模型 . 在 1 多 的 水 平 下 存在 
杠杆 效应 吗 ? 

(b) 给 对 数 收 益 率 序 列 建立 一 个 一 般 的 门限 波动 率 模型 . 

(c) 比较 两 个 TGARCH 模型 . 

4.2 考虑 通用 电气 (GE) RARA 1926 年 1 月 到 2003 年 12 月 股票 的 月 简单 收益 率 . 你 可 
以 从 CRSP 下 载 数据 或 使 用 网 上 的 文件 m-ge2603.txt. 把 收益 率 转化 为 对 数 收 益 率 , 并 
以 百分比 形式 给 出 . 设 a1_1 是 上 一 1 时 刻 的 扰动 , 给 上 述 数据 建立 一 个 以 aa 为 门限 变 
量 、0 为 门限 的 带 GED 新 息 的 门限 TGARCH 模型 , 并 写 下 所 拟 合 的 模型 . 在 5% 的 水 
平 下 存在 杠杆 效应 吗 ? 

4.3 假设 GE 股票 的 月 对 数 收益 率 (以 百分比 形式 ) 服从 一 个 平滑 的 门限 GARCH(1, 1) 模型 ， 
对 样本 时 间 区 间 为 1926 年 1 月 至 1999 年 12 月 的 数据 , 拟 合 的 模型 为 


re = 1.06 + at, Qt — oer, 


1 
1 + exp(—10a,- 1) 


其 中 所 有 的 估计 值 都 是 高 度 显 著 的 ; 指数 中 的 系数 10 是 事先 给 定 的 , 以 便 简 化 估计 过 程 ; 
{er} 是 独立 同 分 布 、 服 从 N(0,1) 的 序列 . 假设 asss = 16.0 和 oss = 50.2. 1 步 向 前 波 
动 率 预 测 值 ossa (1) 是 什么 ? 如 果 换 成 assa = 一 16.0, 那么 1 步 向 前 波动 率 预 测 值 58ss(1) 
又 是 什么 ? 

4.4 假设 一 支 股 票 的 月 对 数 收益 率 (以 百分比 形式 ) 服从 如 下 的 马尔 可 夫 体 制 转 换 模型 : 


a? = 0.103a2. , + 0.95262. , + (4.490 — 0.19367 ,), 


n= 1.25-Fa,, 二 


gi 0.1022. , + 0:9302, 如 果 — 1, 
, 4.24--0.10a2 , +0.7802 ,, 如 果 s: =2, 
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其 中 转移 概率 为 
P(s,—2|s-i— 1) 20.15, Plst = 1lst_1 = 2) = 0.05. 


假设 aio = 6.0, 7799 = 50.0 并 且 以 概率 1 有 si00 — 2. A t= 100 为 预测 原点 的 1 步 
向 前 波动 率 预 测 值 是 什么 ? 如 果 sioa = 2 的 概率 减 小 到 0.8, BAW t= 100 为 预测 原点 
的 1 步 向 前 波动 率 预 测 值 又 是 什么 ? 

4.5 再 考虑 通用 申 气 (GE) 股票 的 从 1926 年 1 月 到 2003 年 12 月 股票 的 月 简单 收益 率 . 用 
后 三 年 的 数据 来 进行 预测 评价 ， 

(a) 用 延迟 收益 率 rei, ra 和 res 作为 输入 值 , 给 此 收益 率 序列 拟 合 一 个 3-2-1 的 前 
馈 神经 网 络 , 并 计算 其 1 步 向 前 预测 及 预测 的 均 方 误差 . 

(b) 用 延迟 收益 率 rei, rio, rica 及 其 符号 (方向 ) 作为 输入 值 , 给 此 收益 率 序列 拟 合 一 
个 6-5-1 的 前 馈 神 经 网 络 , 并 预测 1 步 向 前 GE 股票 价格 运动 的 方向 , 其 中 1 表示 向 
上 运动 . 计算 预测 的 均 方 误差 , 

提示 : 设 rtn 是 S-Plus 中 的 一 个 时 间 序 列 , 为 了 得 到 该 序列 的 方向 变量 , 使 用 命令 drtn= 

ifelse(rtn>0,1,0). 

4.6 AA TEA 9I Dg £5 F3 rp (10630 i £k. 所 以 利率 差 是 非 线性 的 . 为 了 验证 这 个 事实 , 我 
们 考虑 美国 的 两 种 周 利 举 : (a) 1 年 期 固定 期 限 国库 券 ; (b) 3 年 期 固定 期 限 国 库 券 . 如 
第 2 章 中 一 样 , 记 这 两 种 利率 分 别 为 ri 和 rae. 数据 的 时 间 区 间 为 1962 年 1 月 5 日 到 
1999 年 9 月 10 O. 数据 可 从 网 上 文件 w-gs3yr.txt 和 w-gsiyr.txt 中 得 到 , 也 可 以 从 
E- 路 易 斯 联邦 储备 银行 得 到 . 

(a) 用 se = rae — ru 表示 对 数 利率 之 差 . {st} 是 线性 的 吗 ? 进行 非 线性 检验 , 并 在 596 
的 显著 水 平 下 得 出 结论 . 

(b) Hi s? = (rat — rae—1) — (rie — T1451) = St — Se 表示 利率 差 的 变化 . {s7} 是 线性 
的 吗 ? 进行 非 线性 检验 , 并 在 5% 的 显著 水 平 下 得 出 结论 . 

(c) 对 {st} 建立 一 个 门限 模型 , 并 检验 所 拟 合 的 模型 . 

(d) * (sz) 建立 一 个 门限 模型 , 并 检验 所 拟 合 的 模型 ， 
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BOB e 3E c 9n ^] i d f] RT IR Eb p EL DL. 金融 中 常 指 以 日 或 更 小 的 时 
间 间 隔 抽取 的 观测 值 . 由 于 数据 的 获得 与 处 理 方法 的 进一步 发 展 , 这 些 高 频数 据 目 
前 是 可 以 得 到 的 , 并 且 由 于 其 在 市 场 微观 结构 实证 研究 方面 的 重要 性 而 受到 了 广泛 
的 关注 . 金融 中 最 极端 的 高 频数 据 是 证 券 市 场 中 记录 每 一 笔 交易 或 贸易 的 数据 . 这 
里 的 时 间 通 常 以 秒 为 单位 测量 ， 纽 约 股 桌 交 易 所 的 交易 行情 数据 库 包 含 了 整理 过 
的 从 1992 年 至 今 的 所 有 证 券 交 易 的 记录 . 它 包 括 了 在 NYSE. AMEX. NASDAQ, 
以 及 美国 在 纽约 以 外 地 区 的 证 券 交 易 所 的 交易 数据 ， 伯 克利 (Berkeley) 期 权 数 据 
库 为 期 权 交 易 提 供 了 从 1976 年 8 月 至 1996 年 12 月 的 类 似 数据 . 对 于 国内 外 其 他 
许多 证 券 以 及 市 场 的 交易 数据 都 是 连续 收集 和 处 理 的 . Wood (2000) 提供 了 一 些 关 
于 高 频 金 融 研究 的 历史 观察 法 . 

高 频 爹 融 数据 在 研究 与 交易 过 程 和 市 场 微 观 结构 相关 的 大 量 问题 中 都 很 重要 . 
可 以 用 它们 来 比较 不 同 交 易 系 统 (如 NYSE 的 公开 叫价 系统 和 NASDAQ 的 计算 机 
交易 系统 ) 在 价格 发 现 (price discovery) 方面 的 有 效 性 ; 还 可 以 用 他 们 来 研究 某 只 
特定 股票 买卖 报价 的 动态 性 (如 Hasbrouck, 1999; Zhang, Russell 和 Tsay, 2001b). 
在 一 个 指令 驱动 的 股票 市 场 (如 台湾 股市 交易 所 ) 中 , 高 频数 据 还 可 以 用 来 研究 指 
AMA, 更 有 趣 的 是 可 以 用 它们 来 研究 “是 谁 提供 了 市 场 的 流动 性 ”这 样 的 问题 . 
Cho, Russell, Tiao 和 Tsay (2003) 利用 在 台湾 股市 交易 所 中 交易 的 340 多 只 股票 
在 一 天 中 每 5 分 钟 的 收益 率 研究 了 设 定 日 股价 上 下 限 的 影响 , 并 发 现 了 向 股价 上 
限 趋 近 磁 效 应 的 显著 证 据 . 

然而 , 高 频数 据 还 有 一 些 低频 数据 中 不 会 出 现 的 独特 特征 . 因此 对 于 这 些 数 据 
的 分 析 就 给 金融 经 济 学 家 与 统计 学 家 提出 了 新 的 挑战 . 本 章 主要 研究 这 些 特殊 的 特 
征 . 考虑 分 析 高 频数 据 的 方法 并 讨论 所 得 结果 的 应 用 . 特别 地 , 我 们 讨论 了 非 同 步 
交易 、 买 卖 报价 价差 (bid-ask spread)、 持 续 期 模型 、 大 量 小 间隔 上 的 价格 运动 以 及 
关于 价格 变化 和 与 价格 变化 相关 的 交易 之 间 的 时 间 持 续 期 的 二 元 模 漠 .所 讨论 的 
这 些 模型 在 其 他 科学 领域 (如 通信 和 环境 ) 的 研究 中 也 是 适用 的 . 


5.1 非 同 步 交 易 


我 们 以 对 非 同步 交易 的 讨论 开始 . 股票 交易 (如 同 NYSE 中 的 一 样 ) 并 不 是 同 
步 发 生 的 , 不 同 的 股票 有 着 不 同 的 交易 频率 ; 即使 是 同一 种 股票 , 其 交易 强度 也 是 
一 小 时 一 小 时 、 一 天 一 天 地 变化 的 .然而 我 们 经 常 是 对 一 个 固定 的 时 间 间 隔 如 一 
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大 、 一 周 或 者 一 个 月 来 分 析 收 益 率 序列 . 对 于 日 收益 序列 , 股价 指 的 是 其 收盘 价格 ， 
即 该 股票 在 一 个 交易 日 内 最 后 一 次 交易 的 价格 , 而 股票 最 后 一 次 交易 的 实际 时 间 也 
是 一 天 天 变化 的 . 这 样 , 如 果 我 们 假定 日 收益 率 序列 在 24 小 时 里 等 间隔 往往 是 不 
正确 的 . 实践 证 明 , 这 种 假定 可 以 导致 , 甚至 是 在 真实 的 收益 率 序列 是 序列 独立 的 
时 候 , 股票 收益 率 可 预测 性 的 错误 的 结论 . 

对 于 股票 口 收益 率 , 非 同步 交易 可 以 导致 : (a) 股票 收益 率 之 间 的 一 步 延 迟 交 
又 相关 ; (b) 组 合 收益 率 的 一 步 延迟 序列 相关 ; (c) 某 些 情形 下 单 只 股票 收益 率 序列 
的 负 序 列 相关 . 考虑 股票 4 与 B. 假定 这 其 只 股票 是 独立 的 , 并 且 股票 4 比 股票 
B 的 交易 频繁 . 对 于 在 某 天 接近 收盘 时 刻 出 现 的 一 个 特定 的 影响 市 场 的 消息 , 股票 
A 比 股票 B 更 可 能 在 同一 天 中 显示 出 这 个 消息 的 效应 , 这 是 因为 A 的 交易 更 频繁 
该 消息 对 股票 B 的 效应 最 终 也 会 出 现 , 但 是 可 能 会 被 延迟 到 下 一 个 交易 日 . 如 果 这 
种 情况 发 生 , 则 好 像 是 股票 4 的 收益 率 引 导 着 股票 B 的 收益 率 . 因此 , 尽管 这 两 只 
股票 独立 , 但 是 它们 的 收益 率 序列 可 能 会 显示 出 显著 的 一 步 延迟 交叉 相关 性 . 对 于 
一 个 持 有 股票 A 与 股票 B 的 组 合 , 前 面 的 交叉 相关 将 会 变 成 一 个 显著 的 一 步 延 迟 
序列 相关 . 

更 复杂 的 是 , 非 同步 交易 也 能 引起 单 只 股票 错误 的 负 序 列 相 关 . 可 以 利用 文献 
中 的 一 些 模型 来 研究 这 种 现象 . 具体 可 参见 Campbell, Lo 和 MacKinlay (1997) 及 
其 参考 文献 . 这 里 我 们 采用 Lo 和 MacKinlay (1990) 提出 的 模型 的 一 个 简化 形式 . 
令 re 表示 证 券 在 t 时 刻 的 连续 复合 收益 率 . 为 了 简便 , 假定 {re} 是 一 个 独立 同 分 布 
的 随机 变量 序列 , 均值 E(x,) = n. 方差 Var(r*) = o2. 对 每 个 时 间 段 , 证 券 不 交易 的 
概率 为 r, 它 不 随时 间 变 化 , 并 且 与 7 独立 . 4 rt 表示 观测 到 的 收益 率 , 如 果 t 时刻 
没有 交易 , 则 0 一 0, 因为 此 时 没有 可 以 利用 的 信息 . 如 果 + 时 刻 有 一 个 交易 , 则 我 
们 定义 v? 为 从 前 一 个 交易 开始 的 累积 收益 率 (也 就 是 说 ， re 一 至 十 ri- 十 :十 FE 
其 中 k EMET t— ke tk +1, t-11 时 刻 没有 交易 发 生 的 最 大 的 非 负 整数 )， 
rt r? 的 关系 用 数学 式 子 表示 和 如下: 


0, 以 概率 7， 
Tt, 以 概率 (1 — 2)? 
Tj -- Tit 以 概率 (1 += TYT, 
a ee ee (5.1) 
k 
3 res 以 概率 (1 — 0)?s*-1, 


这 些 概 率 很 容易 理解 . 例如 , r? =r, 4 BLANC + 时刻 与 1_1 时 刻 都 有 交易 发 生 ; 
r? = ru reas. BUS t 时刻 与 + 一 2 时 刻 都 有 交易 发 生 , 但 是 1 1 时 刻 无 交易 
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PA TD — n +a dress 当 且 仅 当 上 时 刻 与 + 一 3 时 刻 都 有 交易 发 生 , 但 是 t+ 一 1 
时 刻 与 上 _ 2 时 刻 无 交易 发 生 ; 等 等 . 正如 所 期 望 的 那样 , 总 概率 为 1, 由 下 式 给 出 


1 
w+ (-mfnemee€)x]---ü-x*fl0l—--*7t*l---l 


我 们 准备 考虑 观测 的 收益 率 序列 (00) 的 矩 方程 . 首先 , 7? 的 期 望 是 
E(r?) = (1 — 2)?E(ri) + (1 — 2)? rE (re + rii) + °° 
= (1— «)?u + (1 — »)?z2p + (1— z)^?3g---- 
= (1— T) [l + 20 + 32? + Ar? + ---] (5.2) 


l 
=(1- Uae = p. 


在 上 面 的 推导 中 , 我 们 利用 了 结果 : 1420 +30? 十 4n? 十 -… 一 = 下 一 步 , 对 
F ro 的 方差 , 我 们 利用 Var(r?) = Ef(r?)?] — [E(r?)]*, 以 及 
E(r2)? 一 (1 一)2E[(ro)3] + (1 — 2)?nE[(ri + re 1)*] 4- es 
= (1 — vy! [(o* + u?) + 1(2a? + Au?) + 1? (307 + gu") 4- ---] (5.3) 
= (1 — x)? (e?[1 4 2 + 32? 4] + [0 7474-92? 4 ]) (5-4) 
=a? +p? Fe 一 | à (5.5) 
在 方程 (5.3) 中 , 我 们 利用 了 在 r 是 序列 独立 的 假定 下 式 成 立 : 
k 2 k k 2 
E (>: res] = Var (x 2 十 | p ni) = (k + 1)e? + |(k + Dap?. 
i=0 i=0 


i=0 


利用 与 方程 (5.2) 类 似 的 方法 , 我 们 能 够 证 明 方程 (5.4) 的 第 一 项 可 简化 为 "” 对 
于 方程 (5.4) 的 第 二 项 , 我 们 利用 恒等式 


2 1 
1+4 2 十 1673 二 = 二 
十 4Tr 十 9r 十 167 十 本 二 


此 恒等式 可 以 如 下 推出 . 令 
H=14404+9n2 41603 +- H G=1+3r+5r +T e. 
那么 (1-r)H=GH 


(1—7)G = 14-22-27? - 21? -- --- 


SOL acp dh i) has —]1. 
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因此 , 从 方程 (5.2) 与 方程 (5.5) 中 可 以 得 出 
Var(r?) =a? +u | >. 一 1 sie =P rm. (5.6) 
下 一 步 考虑 (r7) 的 一 步 延迟 自 协 方差 . 这 里 我 们 利用 
Cov(rtyrE 1) — E(r?r?.1) — E(rf)E(r? 1) = E(r?r?_y) — p”, 


则 这 个 问题 简化 为 寻找 E (rr? i). 时 刻 无 交易 或 者 t — 1 时 刻 无 交易 
或 者 + 时 刻 与 + 一 1 时 刻 都 无 交易 , 则 Pr? = 0. 因此 , 我 们 得 到 


0, IRET 一 7, 
TiTt—1) 以 概率 (1 -— r)’, 
Te(Tt-1 + re—2), 以 概率 (1 一 站)3r， 
A = re(te-1+1r-2 +113), 以 概率 (1 — 0)92?, (5.7) 
k 
Tt vif Tei 以 概率 (1 一 nn)3n* !, 


"i tt | | n nw 


总 概率 也 是 1， 为 了 理解 前 面 的 结果 , 注意 到 ror?_ = nsa 当 且 仪 当 在 时 刻 
t 一 2, 4 一 1 和 上 上 有 三 个 连续 的 交易 .利用 方程 (5.7) 以 及 对 j > 0, E(riri-;) = 
E(ri)E(ri-;) = u°, 我 们 得 到 


3 
E(r?r?. 1) = (1—7)? {Btn tr tr + re [ (>: "4 CIRS | 


= (1 — n) RP [L + 2v 4 32? + ---] 一 (1 一 站 722. B 
(r2) 的 一 步 延 迟 自 协 方差 为 
Cov(r?, r? ,) 2 rp’. (5.8) 
假定 u 不 为 零 , 则 非 同步 交易 引起 的 v0 的 一 步 延 迟 白 相关 系数 由 下 式 给 出 


—(1 — rru? 
(1 — r)a? + 2nu? 


一 般 地 , 我 们 可 以 推广 前 面 的 结果 , 并 且 证 明 


mr?) = 


Cov(r?, riy) — —u^n?, jel. 


一 步 延迟 ACF 的 大 小 依赖 于 ur 与 o 的 选择 , 并 且 可 以 是 真实 的 . 这 样 , pe £0 
时 , 非 同步 交易 就 导致 了 观测 到 的 证 券 收益 率 序列 之 间 的 负 自 相关 性 . 
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前 面 的 讨论 可 以 推广 到 一 个 包含 N 种 证 券 的 资产 组 合 的 收益 率 序 列 ; 见 Camp- 
bell. Lo 和 MacKinlay (1997, 第 3 章 ). 在 时 间 序 列 文献 中 , 非 同步 交易 对 于 单个 证 
券 收益 率 的 效应 等 价 于 关于 一 个 时 间 序 列 的 随机 的 时 间 积 累 , 此 时 不 交易 的 概率 r 
控制 了 积累 的 机 制 |. 


5.2 ”买卖 报价 差 


在 革 些 股票 交易 所 (如 纽约 证 券 交易 所 ), 做 市 商 在 促进 交易 方面 起 了 非常 重 
要 的 作用 . 他们 提供 了 市 场 流动 性 (market liquidity): 每 当 公 众 有 买卖 的 愿望 时 ， 
他 们 随时 都 准备 好 进行 买 或 卖 . 市 场 流动 性 是 指 能 快速 地 、 匿 名 地 、 几 乎 没有 价格 
影响 地 买卖 相当 数量 证 券 的 能 力 . 作为 提供 流动 性 的 回报 , 交易 所 赋予 做 市 商 对 证 
券 的 买卖 双方 传递 不 同 价格 的 菊 断 权 . 他 们 以 标价 Pe 购买 , 以 更 高 的 叫价 P, 卖 
出 (对 公众 来 说 , Dy 是 卖 出 价格 , P 是 买 入 价格 ) . 价格 差 Pa — P, 称 为 买卖 报价 
差 . 这 是 做 市 商 获得 报酬 的 主要 来 源 . 买卖 报价 差 一 般 比较 小 , 也 就 是 一 两 个 最 小 
升降 档 . 

买卖 报价 差 尽管 数量 上 比较 小 , 但 是 它 的 存在 对 于 资产 收益 率 时 间 序 列 的 性 质 
有 几 个 重要 的 影响 . 我 们 这 里 主要 讨论 买卖 报价 弹性 , 即 买卖 报价 差 引起 的 资产 收 
益 率 的 一 步 延 迟 负 序列 相关 . 考虑 Roll (1984) 的 简单 模型 . 假定 观测 到 的 资产 市 场 
价格 P, 满足 

PR =P; + hi: (5.9) 

其 中 S= P, — P, 表示 买卖 报价 差 ，P 表示 一 个 无 摩擦 市 场 中 资产 在 t+ 时 刻 的 基 
本 价值 , {1,} 是 一 个 独立 的 、 服从 等 概率 二 项 分 布 的 随机 变量 序列 ( 即 以 概率 0.5, 
I, 二 1: 以 概率 0.5, 1, = —1). 五 可 以 解释 为 一 个 指令 型 的 示 性 变量 , 日 取 1 表示 买 
方 发 动 的 交易 ; 取 1 表示 卖方 发 动 的 交易 . 换 一 种 说 法 , 模型 可 以 写 为 


oe, J 9/2, 以 概率 0.5， 
| — 5/2, 以 概率 0.5. 


如 果 Pr 不 变 , 那么 价格 变化 的 观测 过 程 为 
AP; = (k— lays. (5.10) 


在 方程 (5.9) 对 于 n 的 假定 下 ,我 们 有 EU) = 0, Var(4j) = 1, 从 而 可 以 得 到 
E(AP,) = 0, 而 且 
Var(AP,) = S?/2, (5.11) 
Cov(AP;, AP, 1) = —S?/4, (5.12) 
Cov(AP;,, ^P, ;)—0, j>1. (5.13) 
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因此 , AP, 的 白 相 关 函 数 为 


0.5, 43$ j=1, (5.14) 


A 2 
PIAR) T E j21 


这 样 买 卖 报价 差 就 导致 观测 到 的 价格 变化 序列 的 一 步 延迟 负 相 关 ， 这 在 金融 文献 中 
一 般 称 为 买卖 报价 弹性 . 对 此 , 我 们 可 以 从 下 面 的 直观 意义 上 来 理解 假定 基本 价 
格 Pr 等 于 (Pa + P,)/2, 那么 已 RAP, 5 Dy 两 种 取 值 . 如 果 前 面 观测 到 的 价格 
为 Pa ( 较 高 的 值 ), 则 当前 观测 到 的 价格 要 么 不 变 , 要 么 为 Po 从 而 AP, BAH 0, 
BAA -5; 然而 , 如 果 前 面 观 测 到 的 价格 为 P, (BURMA), 则 AP, BAH 0, BA 
为 5. AP, 的 一 步 延迟 负 相关 变 得 很 明显 . 但 是 , 买卖 报价 差 并 不 会 引起 任何 超过 
一 步 延 迟 的 序列 相关 ， 

一 个 更 加 现实 的 表示 是 假定 Pr 服从 随机 游 动 , 满足 AP? = PrP? = en 这 
形成 了 一 个 均值 为 0, 方差 为 o? 的 独立 同 分 布 的 随机 变量 序列 , 并且 {er} 5 {i} 
BOL. 在 这 种 情形 下 , Var(AP,) = a? + S?/2, 但 是 Cov(AP,, AP,_;) 是 不 变 的 , 从 
而 


虽然 AP, 的 一 步 延 迟 自 相关 的 大 小 减 小 了 , 但 是 当 5 = P, — P, > 0 时 , 负 效应 
还 是 存在 的 . 在 金融 中 , 研究 买 夹 报价 差 的 组 成 比较 有 趣 ， 感 兴趣 的 读者 可 以 参考 
Campbell, Lo 和 MacKinlay (1997) 及 其 参考 文献 . 

瑞 卖 报价 差 的 效应 在 组 合 收益 率 与 多 元 金融 时 间 序 列 中 也 是 存在 的 ， 我 们 考 
虑 二 元 的 情形 , 用 = (Lit. Tat)’ 表示 二 元 指令 型 示 性 变量 ， Kun, 是 第 一 种 证 券 
的 示 性 变量 , 12, 是 第 二 种 证 券 的 示 性 变量 . 如 果 n, 与 p, 是 同步 相关 的 则 买卖 
报价 差 可 以 引起 负 的 一 步 延 迟 交叉 相关 . 
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È ti RPA RB i 次 交易 发 生 的 时 刻 ， 它 是 从 午夜 开始 以 秒 为 单位 测量 的 
日 历时 间 . 有 几 个 变量 与 交易 相关 , 如 : 交易 价格 、 交 易 量 、 盛行 的 买卖 报价 等 等 . 
的 集合 与 相关 的 度量 一 般 称 为 交易 数据 , 这 些 数 据 有 几 个 重要 的 特征 . 这 些 特 征 
当 观 测 值 随时 间 加 总 时 不 存在 . 下 面 我 们 给 出 一 些 特征 . 

(1) 不 等 间隔 的 时 间 区 间 : 交易 (如 交易 所 里 面 的 股票 交易 ) 一 般 不 是 在 等 间 
隔 的 时 间 区 间 上 发 生 的 , 这 样 观测 到 的 资产 的 交易 价格 并 不 形成 一 个 等 间隔 的 时 间 
序列 . 从 而 交易 间 的 时 间 持 续 期 变 得 非常 重要 , 并 且 可 能 包含 了 关于 市 场 微观 结构 
(例如 交易 强度 ) 的 有 用 信息 . 

(2) 离散 取 值 的 价格 : 资产 从 一 个 交易 到 另外 一 个 交易 的 价格 变化 只 在 最 小 变 
动 价位 的 倍数 中 发 生 . 在 NYSE H, 最 小 变动 价位 在 1997 4E 6 月 24 日 以 前 是 1/8 
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美元 , 2001 年 1 月 29 日 以 前 是 1/16 美元 . 在 2001 年 1 H 29 日 , 所 有 的 NYSE 
和 AMEX 股票 都 开始 以 小 数 为 单位 进行 交易 , 因此 价格 在 交易 数据 中 是 离散 取 值 
的 变量 . 在 某 些 市 场 中 , 价格 的 变化 也 可 能 受 监管 者 设 定 的 条 件 的 限制 . 

(3) 日 周期 或 者 日 模式 的 存在 : 在 正常 交易 条 件 下 ， 交易 活动 能 够 展示 周期 模 
xt. 举例 说 , 在 NYSE 中 , 开盘 与 收盘 时 刻 的 交易 比较 频繁 , 而 中 午时 间 交 易 比较 
少 , 导致 了 UU" 型 的 交易 强度 . 因此 , 交易 之 问 的 时 间 持 续 期 亦 呈 现 口 循环 模式 . 

(4) 一 秒 钟 的 多 重 交 易 : 多 重 交易 , 甚至 是 具有 不 同 价格 的 多 重 交 易 同时 发 生 
是 可 能 的 . 这 部 分 是 由 于 时 间 以 秒 来 测量 , 而 在 大 量 交 易 期 间 , 这 种 时 间 长 度 可 能 
还 是 太 长 的 事实 . 

为 了 描述 这 些 特征 , 我 们 首先 考虑 从 1990 年 11 月 1 日 到 1991 年 1 月 31 日 
的 IBM 交易 数据 . 这 些 数据 来 自 于 TORQ(Trades, Orders, Reports and Quotes, 即 
交易 、 指 令 、 报 告 、 报 价 ) 数据 集 , 具体 可 参见 Hasbrouck (1992). 共有 63 个 交易 
H. 60 328 次 交易 .为 了 简化 讨论 , 我 们 忽略 了 交易 日 间 的 价格 变化 , 集中 讨论 发 
生 在 东部 时 间 早 上 9: 30 至 下 午 4: 00 的 正常 交易 时 间 里 的 交易 . 众所周知 , 头 天 
晚上 的 股票 收益 率 与 当天 的 收益 率 有 显著 不 同 , 具体 可 参见 Stoll 和 Whaley(1990) 
及 其 参考 文献 de 5-1 以 百分比 形式 给 出 了 价格 变化 的 频率 , 其 中 最 小 变动 价位 
为 81/8=80.125. 从 表 中 我 们 做 出 以 下 结论 . 


表 5-1 IBM 股票 从 1990 年 11 月 1 日 到 1991 年 1 月 31 日 
以 最 小 变动 价位 的 倍数 变化 的 价格 变化 频率 
数量 (tick) <-3 —2 一 1 0 1 2 23 
百分比 0.66 1.33 14.53 67.06 14.53 1.27 0.63 


(1) KA 2/3 的 日 交易 是 没有 价格 变化 的 ; 

(2) 一 个 最 小 变动 价位 的 价格 变化 接近 于 日 交易 的 2976; 

(3) 只 有 2.6% 的 交易 与 两 个 最 小 变动 价位 的 价格 变化 相关 ; 

(4) 只 有 1.3% 的 交易 导致 三 个 或 者 更 多 个 最 小 变动 价位 的 价格 变化 ; 

(5) 正 负 价格 变化 的 分 布 是 渐 近 对 称 的 . 

下 面 考虑 每 5 分 钟 的 时 间 间 隔 上 的 交易 量 . 用 zx; 来 表示 此 序列 . 也 就 是 说 , zl 
表示 在 1990 年 11 H 1 H, IBM 从 上 午 9: 30 至 9: 35 的 交易 量 ; zz 表示 IBM 从 
上 午 9: 35 至 9: 40 的 交易 量 , 等 等 . 忽略 交易 日 之 间 的 时 间 间 隙 . 图 5-1a 画 出 了 
zt 的 时 间 序 列 图 , 图 5-1b 描述 了 x, 延迟 一 阶 至 260 阶 的 样本 ACF. 尤其 有 趣 的 是 
ACF 的 周期 为 78 的 循环 模式 , 这 正好 是 一 个 交易 日 内 每 5 分 钟 间隔 的 数量 . 这 样 ， 
交易 量 呈现 出 日 模式 . 为 了 更 进一步 地 描述 日 交易 模式 , 图 5-2 画 出 了 63 天 的 每 
5 分 钟 的 平均 交易 量 , 共有 78 个 这 样 的 平均 数 . 这 个 图 形 呈 现 出 “微笑 ”形状 或 者 
sU 的 形状 , 表明 在 市 场 开 盘 与 收盘 的 时 候 交 易 多 , 而 午时 交易 少 的 特点 . 
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(a) 


0 I000 2000 3000 4000 5000 
5 分 钟 的 时 间 区 间 


(b) 


0 50 100 150 200 250 
间隔 


图 5-1 IBM 从 1990 年 11 月 1 日 至 1991 年 1 H 31 日 的 日 交易 数据 : 
(a) 每 5 分 钟 间 隔 内 的 交易 次 数 ; (b) (a) 中 序列 的 样本 ACF 


25 
20 | 


ü 10 20 30 40 50 60 70 80 
5 分 钟 的 时 间 区 间 
图 5-2 每 5 分 钟 间 隔 的 平均 交易 次 数 的 时 间 图 对 1BM 股票 从 1990 年 11 月 1 日 
Æ 1991 年 1 A 31 日 共 63 个 交易 日 的 平均 , 共 78 个 观测 值 


因为 我 们 着 重 讨 论 在 一 个 交易 日 中 的 正常 交易 时 间 发 生 的 交易 , 故 在 数据 中 
总 共有 59 838 个 时 间 间 隔 . 这 些 间 隔 称 为 交易 之 间 的 日 持续 期 . 对 IBM 股票 有 
6 531 个 零 时 间 间 隔 . 也 就 是 说 在 从 1990 年 11 月 1 日 至 1991 年 1 月 31 日 之 间 的 
63 个 交易 日 的 正常 交易 时 间 内 , 每 秒 钟 的 多 重 交易 发 生 了 6 531 次 , 大 约 是 10.91%. 
在 这 些 多 重 交 易 中 , 有 1 002 个 有 着 不 同 的 价格 , 这 大 约 是 全 部 日 交易 量 的 1.67%. 
因此 , 多 重 交 易 ( 即 零 息 持续 期 ) 可 能 会 成 为 交易 之 间 的 时 间 持 续 期 统计 模拟 中 的 
一 个 问题 . 

de 5-2 提供 了 价格 运动 的 两 种 分 类 方式 . 这 里 , 价格 运动 被 分 成 “上升 *" “R 
R. FE 三 类 , 我 们 将 它们 分 别 表示 为 "o7, “0” 和 “-”. 此 表 给 出 了 样本 在 两 
个 连续 交易 日 内 (从 第 ;一 1 个 交易 日 至 第 i 交易 日 ) 的 价格 运动 . 由 表 中 , 交易 对 
交易 的 数据 表明 : 
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表 5-2 IBM 股票 相 邻 两 个 日 内 交易 的 价格 变动 的 分 类 “ 


NGC Dad W CL 边缘 
十 0 = 
B 441 5 498 3 948 9 887 
0 4 867 29 779 5 473 40 119 
- 4 580 4 B41 4 10 9 831 
边缘 9 RRR 40 118 9 831 59 837 


a MREZA “tr. pex". "FREE = 28. 数据 的 时 间 区 间 为 1990 年 11 月 1 日 到 1991 年 1 
H 31 日 . 


(1) 连续 的 价格 递增 或 者 递减 的 情形 是 相当 少 的 , 分 别 是 441/59 837=0.74%, 
410/598 37=0.69%; 

(2) 从 表 的 第 1 行 看 出 , 有 轻微 的 从 “上 升 * 到 “不 变 ” 而 不 是 到 “下 降 ” 的 移 
3j; 

(3) 价格 保持 “不 变 ” 的 倾向 很 高 ; 

(4) 从 第 3 行 可 以 看 出 , M * FEE" 到 “上 升 * 或 者 “不 变 ” 的 概率 大 致 相 同 . 

前 面 提 到 的 第 一 个 观测 就 是 买卖 报价 弹性 的 一 个 清楚 的 说 明 , 显示 了 日 交易 数 
据 的 价格 逆转 .为 了 确认 这 个 现象 , 我 们 考虑 价格 运动 的 一 个 方向 序列 D, ERB i 
次 交易 中 , T HR ET. 不 变 、 下 降 三 种 情况 , D; 分 别 取 +1、0、-1 三 个 值 . {D,} 
的 ACF 在 延迟 为 1 时 的 取 值 “0.389 是 一 个 单 峰 , 这 对 于 样本 大 小 为 59 837 的 序 
列 来 说 是 高 度 显著 的 , 从 而 证 实 了 连续 交易 中 的 价格 逆转 ， 

作为 第 一 个 解释 , 我 们 考虑 由 TAQ 数据 库 得 到 的 IBM 股票 在 1999 年 12 月 
NIAC Sa BH. 正常 的 交易 时 间 是 从 东部 时 间 早 上 9: 30 至 下 午 4: 00, 12 月 31 日 
这 天 除外 , 因为 这 天 市 场 在 下 午 1: 00 KA. 45 1990-199 年 的 数据 比较 , 发 生 
了 两 个 重要 的 变化 . 首先 , 日 交易 次 数 增 加 了 6 倍 , 仅 在 1999 年 12 月 就 发 生 了 
134 120 次 交易 . 交易 强度 的 增加 也 给 每 秒 钟 的 多 重 交 易 增加 了 机 会 ， 零 时 间 持 续 
期 的 交易 百分比 增长 了 两 倍 , 增长 到 了 22.98% . 更 为 极端 的 是 , 1999 Æ 12 月 3 日 
在 给 定 的 一 秒 钟 内 发 生 42 次 交易 的 情形 出 现 了 两 次 . 其 次 , 价格 运动 的 最 小 变动 
价位 是 1/16 美元 =0.062 5 美元 , 而 不 是 1/8 美元 . 最 小 变动 价位 的 变化 降低 了 买 
卖 报 价差 . 图 5-3 给 出 了 新 样本 的 日 交易 次 数 . 图 5-4a 是 以 秒 为 单位 测量 的 交易 
时 间 持 续 期 的 时 间 图 . 图 5-4b 是 用 最 小 变动 价位 1/16 美元 的 倍数 测量 的 连续 日 
交易 的 价格 变化 图 . 正如 所 预期 的 , 图 5-3 与 图 5-4a 很 清楚 地 说 明了 日 交易 次 数 与 
交易 的 时 间 间 隔 之 间 的 逆转 关系 . 图 5-4b 描述 了 1999 年 12 月 3 A IBM 股 要 的 
两 个 不 寻常 的 价格 运动 : 其 一 是 先 下 降 了 63 个 价位 , 紧 接 着 上 涨 了 64 个 价位 ; 其 
二 是 下 降 68 个 价位 后 , 紧 接 着 上 涨 了 68 个 价位 . 在 一 个 交易 日 中 , 像 这 样 不 寻常 
的 价格 变化 是 很 少 发 生 的 . 
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p. 
5-3 1999 年 12 月 IBM 的 交易 数据 . 图 中 给 出 了 每 个 交易 日 的 交易 数 , 其 中 有 的 长 条 加 
上 了 标记 时 间 为 当天 下 午 4: 00 以 后 发 生 (after-hours) 的 交易 数 
(a) 


20 000 40 000 60 000 80 000 100 000 120 000 
序列 
(b) 


0 — 20 000 40 000 60 000 80 000 100 000 120 000 
序列 


图 5-4 1999 年 12 H IBM 的 交易 数据 , (a) 交易 之 间 时 间 持 续 期 的 时 间 图 (b) 以 最 小 变 
动 价位 1/16 美元 的 倍数 测量 的 连接 两 个 交易 的 价格 变化 量 的 时 间 图 . 只 包含 正常 
交易 时 间 的 数据 


对 十 在 正常 的 交易 时 刻 中 记录 的 交易 , 在 133 475 个 交易 中 有 61 149 个 交易 
没有 价格 变化 . 这 大 约 是 45.8%, 比 1990 年 11 月 到 1991 年 1 月 这 个 时 间 段 上 的 
没有 价格 变化 的 交易 数 少 很 多 . 看 上 去 是 减少 最 小 变动 价位 增加 了 价格 变化 的 机 
会 . 表 5-3 给 出 了 与 价格 变化 相关 的 交易 数 的 百分比 . 价格 运动 仍然 近似 地 关于 0 
对 称 . 日 交易 中 很 大 的 价格 变化 仍然 相对 很 少 . 


表 5-3 与 1999 年 12 月 交易 的 IBM 股票 的 价格 变化 相关 的 日 交易 百分比 * 


大 小 1 2 3 4 5 6 7 >7 
(a) 上 升 运动 
百分比 18.03 5.80 1.79 0.66 0.25 0.15 0.09 0.32 
(b) 下 降 运 动 
百分比 18.24 5.57 1.79 0.71 0.24 0.17 0.10 0.31 
€ ————————.. —— —Á—  — .—  —— 0: 


a 在 正常 的 交易 时 刻 , 没有 价格 变化 的 交易 的 百分比 为 45.896, 总 交易 其 为 133 4753. 这 个 大 小 是 以 最 
小 变动 价位 1/16 美元 的 倍数 测 基 的 . 
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注释 : 高 频数 据 的 保存 记录 并 不 像 以 较 低 频率 抽取 的 观测 值 那么 好 . 因此 , 在 
高 频数 据 分 析 中 , 很 有 必要 进行 数据 清理 . 对 于 交易 数据 , 很 多 方式 都 可 以 造成 观 
测 值 的 缺失 , 从 而 对 某 些 交易 而 言 , 精确 交易 时 间 的 正确 程度 是 值得 怀疑 的 . 例如 ， 
所 记录 的 交易 时 刻 也 可 能 超过 东部 时 间 的 下 午 4: 00, 其 至 超过 下 一 天 正常 交易 时 
间 开 始 之 前 . 怎样 处 理 这 些 观测 值 值得 仔细 研究 . 数据 清理 的 一 个 适当 方法 要 求 对 
市 场 操 作 的 方式 有 很 深 的 理解 . 因而 , 清楚 准确 地 鉴定 数据 清理 中 使 用 的 方法 非常 
EX. 在 做 出 推断 之 前 , 必须 考虑 这 些 方法 . 口 

另外 , A ti 表示 从 午夜 开始 以 秒 为 单位 测量 的 第 à 次 交易 发 生 的 日 历时 间 , P. 
表示 交易 价格 . 从 第 i 一 1 次 交易 至 第 i 次 交易 的 价格 变化 为 y; = AP, = Pu Phas 
时 间 持 续 期 为 At; = t; — tii. 这 里 理解 为 , Ati 53 y; 的 下 标 表 示 交 易 的 时 间 序 列 ， 
而 椒 是 日 内 时 间 , 在 下 面 的 讨论 中 , 我 们 主要 考虑 y; 与 At; 的 单个 模型 与 联合 模 
型 . 


5.4 ”价格 变化 模型 


离散 化 与 集中 于 “无 变化 ” 这 两 个 性 质 使 得 我 们 对 日 价格 变化 建 模 比较 困难 . 
Campbell, Lo 和 Mackinlay (1997) 讨论 了 文献 中 已 经 提出 的 几 种 计量 经 济 模型 . 在 
这 里 , 我 们 提 及 两 种 利用 解释 变量 来 研究 日 交易 价格 变化 的 模型 .第 一 个 模型 是 
Hauseman, Lo 和 Mackinlay (1992) 在 研究 交易 数据 的 价格 运动 中 使 用 的 顺序 概率 
值 模型 . 第 二 个 模型 最 近 由 McCulloch 和 Tsay (2000) 提出 . 此 模型 是 Rydberg 和 
Shephard (2003) 提出 的 模型 的 一 个 简便 形式 , 也 可 以 参考 Ghysels (2000). 


5.4.1 ”顺序 概率 值 模型 
令 yt 表示 所 研究 的 资产 的 不 能 观测 到 的 价格 变化 (也 就 是 说 , y; = Px PR). 


其 中 Pr 表示 资产 在 t 时 刻 的 真实 价格 . 顺序 概率 值 模型 假定 v? 是 一 个 连续 的 随 
机 变量 , 服从 以 下 模型 


y; = 2; + Ei (5.15) 
其 中 zx; 表示 tia 时 刻 可 以 得 到 的 解释 变量 的 p 维 行 向 量 , 8 是 一 个 kx 1 参数 向 


E, E(e;|a,;) = 0, Var(ei|zi) = a, 并 且 对 于 i Fx j, Cov(ei,cj) = 0. 假定 条 件 方差 
o? 是 解释 变量 w, 的 正 函数 , 即 


a? = g(w;), (5.16) 


其 中 g(-) 是 一 个 正 函数 . 对 于 金融 交易 数据 而 言 , wi 可 能 包含 了 时 间 间 隔 t; tii 
以 及 某 些 条 件 异 方差 变量 . 特别 地 , 也 可 以 假定 e; 在 给 定 m; Aw, 下 的 条 件 分 布 
是 高 斯 的 . 
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假定 观测 到 的 价格 变化 v. 有 个 可 能 的 取 值 , 理论 上 可 以 是 无 穷 大 , 但 必 
须 是 可 数 的 . 实际 应 用 中 ,人 是 有 限 的 , 可 能 涉及 将 几 种 类 别 组 合成 单个 值 . 例如 ， 
在 表 5-1 PRIA k= 7, 其 中 第 一 个 值 “-3 价位 ”意味 着 价格 的 变化 为 —3 个 价 
位 或 者 更 低 , 我 们 将 k 个 可 能 的 取 值 表示 为 {si, sz,… ,sk}, 则 顺序 概率 值 模型 假 
定 yi 与 妈 之 间 的 关系 为 


y —85, A aji <y Sa j= 1 ,hk, (5.17) 


其 中 o; 是 实数 , 满足 -ce 一 ao < ma <… < aka < oy = oo. 在 条 件 高 斯 分 布 的 
假定 下 , 我 们 有 


P(yi = sj|z;,w;) = P(aj-1 < wiB+ Ei € oj|z;, wi) 


P(x, + Ei x Alti; wi), 车 j — Re 


P(oj-i« mB+e &« aj|mi, wi) A j—2,--.k-—1, 


P(ay- < zi + Eilt wi), 车 j=k, 
xf (5.18) 
O1 — Ti E 

e| c, (wi) | Lg j 1; 
= > J- d b goods 
7 | o;(w;) | | c (w,) 1 若 J 2, wk l, 

1-4 ua. Fe 

| c, (w,) 若 J 


其 中 O(c) 是 标准 正 态 随机 变量 的 累积 分 布 函数 在 z 点 的 取 值 , 并 且 我 们 用 o (wi) 
表示 o? 是 wi 的 正 函数 . 从 定义 中 可 以 看 出 , 顺序 概率 值 模型 是 由 未 观测 到 的 连续 
随机 变量 所 驱动 的 . 观测 值 都 有 一 个 自然 序号 , 可 以 认为 是 代表 所 在 过 程 的 类 别 ， 
顺序 概率 值 模型 包含 了 参数 p, aili = 1,… k — 1) 以 及 方程 (5.16) 中 条 件 方 
HAM olw) 包含 的 参数 . 这 些 参数 可 以 通过 最 大 似 然 估计 或 者 是 MCMC 方法 
hi. 
例 5.1  Hauseman, Lo 和 Mackinlay (1992) 对 1988 4E 100 多 种 股票 的 交易 数据 
应 用 了 顺序 概率 值 模型 , 这 里 我 们 仅 描 述 他 们 对 于 IBM 的 结果 , 共有 206 794 个 
交易 . 价格 变化 ys 的 样本 均值 (标准 差 ) 为 -0.001 0 (0.753), 时 间 持 续 期 A 的 
样 木 均值 (标准 差 ) 为 27.21 (34.13), 买卖 报价 差 的 样本 均值 (标准 差 ) 为 1.947 0 
(1.462 5). 买卖 报价 差 是 用 最 小 变动 价位 来 测量 的 . 运用 的 模型 对 于 价格 运动 有 很 
好 的 分 类 , 而 且 指定 函数 为 


3 3 3 
m9 = fı Ati | S Bu+iti—v + Y ^ Bea S P5. + A By. 7IBSj 


v=] v=] v—1 
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3 
+ >> Boxio[TA (Vi v) x IBS;.,], (5.19) 
v—1 
a; (wi) = 1.0+ LAW + 42AB, 5, (5.20) 


其 中 T(V) = (V^ — 1)/\ ÆHF A € [0,1] 的 V AY Box—Cox 变换 . 解释 变量 定 
义 如 下 . 
e. At} = (t; — ti-1)/100 是 第 i- 1 次 交易 与 第 i 次 交易 之 间 尺 度 修正 的 时 间 
持续 期 , 这 里 时 间 是 以 秒 为 单位 测量 的 . 
。 ABi_1 是 时 刻 ti 流行 的 以 最 小 变动 价位 计算 的 买卖 报价 差 . 
© yi_u(v = 1,2,3) 是 在 时刻 以 最 小 变动 价位 计算 的 价格 变化 的 延迟 值 . 对 
于 大 = 9 以 最 小 变动 价位 计算 的 价格 变化 的 可 能 取 值 为 { 一 4 3, 2, 1, 
0,1,2,3, 4}. 
s Vi_v(v = 1,2,3) 是 第 i 一 uv 次 交易 中 交易 额 (美元 数 ) 的 延迟 值 , 定义 为 第 
;一 ”次 交易 的 美元 价格 乘 以 交易 股份 数 ( 股 数 已 经 除 以 100 T). BN, 美元 
数 以 百 为 单位 . 
e SP5i_v(v = 1,2,3) 是 标准 普尔 500 指数 , 在 与 第 i 一 v 次 交易 发 生 的 月 份 
最 靠近 的 那个 月 到 期 的 期 货 价 格 每 5 分 钟 连续 复合 收益 率 . 这 里 的 收益 率 
是 用 ti-o VARTA START Ta] ASAT 1 分 钟 和 前 5 分 钟 记录 的 期 货 价 格 来 
计算 的 . 
e IBS; ,(v = 1,2,3) 是 一 个 示 性 变量 , 定义 为 


1 S Ba > (PP) 
JIBS 0, 当 Py» -— (Po T P? .)/2, 
—1; 4 Pie < FE + PE ..)/3, 


其 中 Pe, Ph HA ty 时 刻 的 卖 价 与 买 价 . 

X 5-4 给 出 了 参数 估计 以 及 它们 的 t- E. 除了 一 个 二 比较 小 以 外 , ER t 比 
都 很 大 , 这 显示 了 估计 是 高 度 显 著 的 . 因为 样本 的 容量 很 大 , 所 以 如 此 高 的 t 比 并 
不 令 人 感到 惊奇 . 对 于 交易 量 很 大 的 IBM 股票 而 言 , 估计 结果 显示 出 如 下 结论 . 

(1) 边界 的 划分 并 不 是 等 间隔 的 , 但 是 关于 0 几乎 是 对 称 的 . 

(2) 交易 的 持续 期 At, 不 仅 影 响 方程 (5.19) 表示 的 y, 的 条 件 均 值 , 而 且 影 响 
方程 (5.20) 表示 的 y; 的 条 件 方差 . 

(3) 延迟 价格 变化 的 系数 为 负 并 且 是 高 度 显著 的 , 显示 了 价格 逆转 性 质 . 

(4) 如 所 料想 的 , ti 时 刻 的 买卖 报价 价差 显著 地 影响 条 件 方差 . 
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表 5-4 对 IBM 股票 1988 年 的 交易 数据 , 方程 (5.19) 和 (5.20) 中 的 
顺序 概率 值 模 型 的 参数 估计 , 其 中 七 表示 万 be” 


概率 值 模 型 的 边界 分 解 
参数 al org qa Q4 a ag az ag 
估计 一 4.67 一 4.16 -3.11 —1.34 1.33 3.13 4.21 4.73 
t —145:7 —157.8 —171.6 —155.5 154.9 167.8 152.2 138.9 
概率 值 模型 的 方程 参数 
参数 71 ya Ry : Att Ba * y.., Bs Ba Bs Bo 
估计 0.40 0.52 —0.12 ~1.01 一 0.53 —0.21 1.12 —0.26 
t 15.6 71.1 —114 —135.6 一 85.0 -473 54.2 -12.1 
参数 Br Bs Bo : Bio Bii B2 Pia 
估计 0.01 —1.14 —0.37 —0.17 0.12 0.05 0.02 
t 0.26 —63.6 —21.6 —10.3 AT.A 18.6 7.7 


a GA Elsevier 授权 复印 . 
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对 价格 变化 建 模 的 另外 一 个 方法 是 将 价格 变化 分 解 为 3 个 组 成 部 分 , 然后 运 
用 每 一 部 分 的 条 件 确 定 . 具体 可 参见 Rydberg 和 Shephard (2003). 这 3 个 部 分 分 
别 为 价格 溉 化 的 示 性 量 、 有 价格 变化 时 价格 变化 的 方向 以 及 价格 变化 发 生 时 变化 
的 大 小 . 具体 来 讲 , 在 第 i 次 交易 中 的 价格 变化 可 以 写 为 


ti = Fa — P, = AiDiSi, (5.21) 


其 中 A; 是 一 个 二 元 变量 , 定义 为 


| 1， 如 果 第 i 次 交易 中 有 价格 变化 ， 
P (5.22) 


0, 如 果 第 i 次 交易 中 无 价格 变化 . 
D; 也 是 一 个 离散 变量 , 它 表示 有 价格 变化 的 时 候 , 价格 变化 的 方向 , BUT 


| 1， 第 i 次 交易 中 价格 上 升 ， 
Di\(Ai = 1) = (5.23) 
-1, Foi 次 交易 中 价格 下 降 ， 


其 中 Dil(4i = 1) 意思 是 说 D; 是 在 A; = 1 的 条 件 下 定义 的 . 当 第 i 次 交易 中 有 价 
格 变化 时 , S; 指 最 小 变动 价位 的 大 小 ; 当 第 i 次 交易 中 没有 价格 变化 时 , S; = 0. 当 
有 价格 变化 时 , S: 是 一 个 止 的 实 值 随 机 变量 . 

注意 到 A, = 0 时 , 不 需要 Di 并 且 在 分 解 中 有 一 个 自然 的 次 序 . 只 有 当 A = 1 
时 , D; 才 有 定义 ; 只 有 当 A; =1 并且 给 定 Di 的 条 件 下 , S; 才 有 意义 . 分 解 中 模型 
的 确定 利用 了 这 个 次 序 . 
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令 表示 第 i 次 交易 中 可 以 得 到 的 信息 集合 . F 的 元 素 为 Atij, Ac. Di- 
以 及 Siil z 0). 在 (5.21) 的 模型 下 , 价格 变化 的 演变 可 以 分 解 为 


P(yi|Fi-1) = P(AiDiS;|Fi-1) 
= P(S|Di, Ai, Fi 1) P(Di| Ai, Fi 3) PCAL FL 1) (5.24) 


因为 A; 是 一 个 二 元 变量 , 所 以 只 要 考虑 随时 间 演 变 的 概率 p; = P(A; = 1) RER 
T. 我 们 假定 


wid 
Di e 
— TD B | 二 ——, 
(2 -) Til 或 1 十 eraiB 


其 中 zi 是 一 个 包含 了 Fa 中 的 所 有 元 素 的 有 限 维 向 量 , 8 是 一 个 参数 向 量 . 在 
A, = 1 的 条 件 下 , D; 也 是 一 个 二 元 变量 , 对 6; = P(D; = 1|A; = 1), 我 们 利用 下 面 
的 模型 


(5.25) 


ô; e | 
In (s = x) = ZY 或 小 一 14+ 67’ (5.26) 


其 中 z; 是 一 个 包含 了 Fin 中 的 所 有 元 素 的 有 限 维 向 量 , y 是 一 个 参数 癌 量 . 为 了 
允许 正 负 价 格 变化 之 间 的 对 称 性 , 我 们 假定 


YD. eee ， g(Aui), WR D;=1,4;=1, 
S;|(D;, A; = 1) ~ 1+ | pow 如 果 i (5.27) 
其 中 g( 和 ) 是 参数 ^ 的 几何 分 布 , 并 日 参数 Mi 随时 间 的 变化 为 
Aj T 可 r ew:8; dE ed 
In (s 十 i) = w;0; 或 Aja = 1,68,’ juu, d, (5.28) 


其 中 wi 指 Koa 中 有 限 维 的 解释 变量 , 0; 是 一 个 参数 向 量 . 
在 方程 (5.27) 中 , 随机 变量 x 服从 几何 分 布 g(A), 其 概率 质量 函数 为 


p(r-m)-2(1—23)", m= 0,1,2,+--. 


我 们 在 几何 分 布 中 加 了 1, 以 便当 发 生 价格 变化 的 时 候 , 价格 的 变化 至 少 为 一 个 最 
小 变动 价位 . 在 方程 (5.28) 中 , 为 了 确保 Azs € [0, 1], 我 们 作 了 logistic 变换 . 

前 面 的 具体 化 将 第 i 次 交易 分 为 三 类 . 

(1) 无 价格 变化 : A; = 0 而 且 相 应 的 概率 为 (1 pi). 

(2) 价格 上 升 : A; = 1, D; = 1, 相应 的 概率 为 po... 价格 上 升 的 大 小 是 由 
1 + g(Aui) 控制 的 . 

(3) 价格 下 降 : Aj = 1, D; = —1, 相应 的 概率 为 pi;(1 — di). 价格 下 降 的 大 小 是 
由 1 十 g(Xai) 控制 的 . 
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对 于 j= 1,2,3, $ LG) 表示 前 面 三 类 的 示 性 变量 , 也 就 是 说 , 当 第 j 类 发 生 
时 , 五 (7) = 1, 当 第 j 类 不 发 生 时 , 1,(j) = 0. 方程 (5.24) 的 对 数 似 然 函 数 为 


In|P(yi|Fi-1)] = (1) In[(1 — p;)] + L,(2)[In(p;) + In(5;) 
T In(A,,;) + (S; E 1) In(1 E Au,i)] 
十 I; (3)[In(p;) 4 In(1 一 âi) + In(Au,i) E (S; — 1) In(1 一 54,)] 


并 且 全 部 的 对 数 似 然 函 数 为 


In[P(yi, **- ,ynlFo)] = >> In[P(yi| Fi1)], (5.29) 
eI 
这 是 参数 B, Y, 9, 以 及 04 的 一 个 函数 . 
例 5.2 ”我们 通过 解释 IBM 股票 从 1990 年 11 月 1 日 至 1991 年 1 月 31 日 的 日 
交易 来 说 明 分 解 模 型 . 共有 63 个 交易 日 , 在 正常 的 交易 时 间 内 发 生 了 59 838 次 日 
内 交易 . 运用 的 解释 变量 如 下 . 
(1) A; 1: 上 一 次 交易 的 行动 示 性 变量 (也 即 在 一 个 交易 日 内 的 第 i 1 次 交 
E). 
(2) Dii: 上 一 次 交易 的 方向 示 性 变量 . 
(3) Si_i: 上 一 次 交易 的 大 小 . 
(4) Vii: 上 一 次 交易 的 成 交 量 除 以 1000. 
(5) Ati: 从 第 i 一 2 次 交易 到 第 i 一 1 次 交易 的 时 间 持 续 期 . 
(6) BA;: 交易 时 刻 的 买卖 报价 价差 . 
因为 我 们 利用 的 是 延迟 为 1 的 解释 变量 , 所 以 实际 的 样本 大 小 为 59 775. 对 于 所 试 
用 的 模型 Vi_1, At;_1 与 BA; 都 不 是 统计 显著 的 , 从 而 我 们 只 运用 了 前 三 个 解释 变 
量 . 采用 的 模型 为 


»( z ) = Bo + Ait, 

1— pi 
ĝi 

in (; e) = "yg + nDi-1,; (5.30) 
^ui 

" (, = - = Sua + 94,15,—1, 
> 

(s Mi) = 44,0 ELE 041 Si 1. 


利用 方程 (5.29) 中 的 对 数 似 然 函数 得 到 的 参数 估计 在 表 5-5 中 给 出 . 估计 得 到 的 简 
单 模型 显示 了 价格 变化 中 的 某 些 动态 依赖 性 . 尤其 是 , TBM 股票 的 交易 对 交易 的 价 
格 变 化 呈现 出 许多 如 下 吸引 人 的 性 质 . 
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X 5-5 H (5.30) 中 对 IBM 从 1990 f£ 11 A 1 AR 1991 年 1 月 31 日 的 日 内 交易 


ADS 模型 的 参数 估计 
参数 Bo f^ "yo yı 8,.0 0,1 84.0 04.1 
估计 一 1.057 0.962 —0.067 一 2.307 2.235 一 0.670 2.085 —0.509 
标准 差 0.104 0.044 0.023 0.056 0.029 0.050 0.187 0.139 


(1) 价格 变化 的 概率 依赖 于 上 一 次 的 价格 变化 . 具体 地 , 我 们 有 
P(A; —1|A;.1—0)— 0.258, P(A; — 1|A;., = 1) = 0.476. 


这 个 结果 显示 价格 变化 的 发 生 是 聚 类 的 . 正如 所 料想 的 , 大 部 分 交易 没有 价格 变化 . 
当 在 第 ji 一 1 次 交易 中 没有 价格 变化 时 , 则 在 随后 的 交易 中 , 只 有 大 约 1/4 的 交易 
有 价格 变化 ; 当 在 第 i 一 1 次 交易 中 有 价格 变化 时 , 在 第 i 次 交易 中 , 价格 发 生变 化 
的 概 涂 增加 为 大 约 0.5. 

(2) 价格 变化 的 方向 由 下 式 控制 


0.483, 如 果 D, li=0( 即 4 :=0)， 


P(D; = 1|Fi-1, Ai) = 4 0.085, WẸ D,,—1,A4;—1, 
0.904, 如果 Dy. =—1,A,;=1. 
这 个 结果 说 明 
CD 如 果 第 i 一 1 次 交易 中 没有 价格 变化 , 那么 在 第 d 次 交易 中 价格 上 升 和 
下 降 的 机 会 是 平等 的 ; 


D 连续 的 价格 上 升 或 者 价格 下 降 的 概率 非常 低 . 给 定 第 i 一 1 中 交易 上 升 
而 且 第 i 次 交易 中 价格 发 生变 化 的 条 件 下 , 第 i 次 交易 的 价格 上 升 的 概 
率 仅仅 只 有 8.6% . 然而 , 在 给 定 第 i 一 1 次 交易 中 下 降 而 旦 第 i 次 交易 
中 价格 发 生变 化 的 条 件 下 , 第 i 次 交易 的 价格 上 升 的 概率 大 约 为 90% . 
因此 , 这 个 结果 显示 了 买卖 报价 弹性 的 影响 , 支持 了 高 频数 据 交 易 中 的 
价格 道 转 . 
(3) 只 有 很 弱 的 证 据 表 明 大 的 价格 变化 有 更 大 的 可 能 性 跟随 另外 一 个 大 的 价格 
变化 , 考虑 价格 增长 的 大 小 , 我 们 有 


Sj(D; =1) ~1 + 9(Au,i), Aui = 2:235 — 0.6705;_1. 


利用 几何 分 布 的 概率 质量 函数 , 我 们 得 到 如 果 交 易 导 致 一 个 价格 增长 而 且 S; a = 1, 
那么 在 第 i 次 交易 中 , 价格 增长 一 个 最 小 变动 价位 的 概率 为 0.827. 当 Sii = 2 时， 
此 概率 下 降 到 0.709, 当 Si = 3 时 下 降 到 0.556. 因此 , 给 定 第 i 次 交易 中 价格 增 
长 的 条 件 下 , 一 个 大 S; 的 概率 与 5;_1 成 反比 . 

ADS 模型 与 顺序 概率 值 模 型 的 一 个 区 别 是 : ADS 模型 并 不 要 求 价格 变化 大 小 
中 的 任何 截断 或 者 分 组 . 


5.5 ”持续 期 模型 


持续 期 模型 主要 考虑 交易 之 间 的 时 间 间 隔 . 较 长 的 持续 期 预示 着 较 少 的 交易 活 
动 , 这 反 过 来 又 表明 了 一 个 没有 新 消息 的 时 期 . 这 样 , 持续 期 的 动态 行为 就 包含 了 
关于 日 内 市 场 活动 的 有 用 信息 . 利用 类 似 于 波动 率 的 ARCH 模型 的 概念 , Engle 和 
Russell (1998) 提出 了 自 回归 条 件 持续 期 (ACD) 模型 来 描述 股票 (尤其 是 大 量 交易 
的 ) 时 间 持 续 期 的 演变 . Zhang , Russell 和 Tsay (2001a) 扩展 了 ACD 模型 来 解释 
数据 中 的 非 线性 性 与 结构 突变 . 本 节 引 进 了 一 些 简单 的 持续 期 模型 . 正如 前 面 提 到 
AY, 日 内 交易 展示 了 一 些 日 模式 . 因此 , 我 们 集中 讨论 调整 的 时 间 持 续 期 


At? = Ati/f (ti), (5.31) 


其 中 f (6) 是 一 个 确定 的 函数 ,有 At; 的 循环 成 分 组 成 . 显然 F(t) 依赖 于 标的 资产 
(underlying asset) 以 及 市 场 的 系统 行为 . 实际 应 用 中 , 有 很 多 估计 f(t;) 的 方法 , 但 
是 根据 统计 性 质 没 有 一 种 方法 总 是 优 于 其 他 方法 的 .光滑 插值 是 一 个 通常 的 方法 ， 
这 里 我 们 运用 简单 的 二 次 插值 函数 与 示 性 变量 来 处 理 日 交易 活动 中 确定 的 组 成 部 
4. 

对 于 用 来 解释 ADS 模型 所 采用 的 IBM 股票 数据 , 我 们 假定 


f(ti) =expld(ti)], (ti) — Bo + M B; Fi (ti), (5.32) 
1—1 
其 中 
t, — 38'700\” 
t; — 43 200? T Er) i t; < 43 200, 
fi(ti) = -( 14 400 ) » fa(ti) = ( 7 500 9s 
0, di ti > 43 200, 
t; — 48 600? 
ti — 48 300? = ( t; > 43 200, 
falti) — — Co) i fale) = 9 000 5 
j 0, dí ty < 43 200. 


falti) 与 felti) 是 市 场 开 盘 时 第 一 个 5 分 钟 与 第 二 个 5 分 钟 的 示 性 变量 , [ 即 无 (.) 一 
1 SHAH t 在 东部 时 间 的 上 午 9: 30 至 上 午 9: 35 之 间 ]. frt) 指 日 交 易 的 最 后 
30 分 钟 的 示 性 值 , [ 即 f(t) = 1 当 且 仅 当 交易 发 生 在 东部 时 间 下 午 3: 30 至 下 午 
4: 00]. 图 5-5 给 出 了 对 于 i= 1,2,3,4, AC 的 图 形 , 其 中 zx 轴 的 时 间 刻 度 是 分 钟 . 
注意 到 fa(43 200) 一 户 (43 200), 其 中 43 200 对 应 于 中 午 12 点 . 

方程 (5.32) 中 的 系数 3; 可 以 通过 线性 回归 的 最 小 二 乘法 得 到 


7 
In(At;) = Bo + >> Bifilti) +- Ei- 


j=l 
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(a) (c) 
0.2 —0.24 7 Y 
—0.6 —().6 
Ay = 
0 100 200 300 400 0 100 200 300 400 
分 钟 
(b) (d) 
0.0 0.2 
一 1.0 —Uu.6 DUX 
一 2.0 =) 
ü 100 200 300 400 0 100 200 300 400 
分 分 钟 


图 55 用 来 消除 IBM 日 内 交易 持续 期 的 确定 成 分 的 二 次 函数 : 
(a)—(d) 分 别 是 方程 (5.32) 中 的 fi(-) 到 fal) 


拟 合 的 模型 为 


In(At;) = 2.555 + 0.159 fi(t;) + 0.270 fa(t;) + 0.384 fa(t;) 
十 0.061 fa (ti) 一 0.611 fs(t,) 一 0.157 fg (ti) + 0.073 f7(ti). 


图 5-6 给 出 了 63 个 交易 日 中 每 5 分 钟 时 间 间 隔 的 平均 持续 期 的 时 间 图 , 包括 
对 于 确定 性 部 分 调整 前 以 及 调整 后 的 图 形 . 图 5-6a 为 Ai 的 平均 持续 期 , 正如 我 
们 所 料想 的 , 它 展示 了 一 个 每 日 模式 . 图 5-6b 为 At? 的 平均 持续 期 (也 就 是 调整 
延迟 的 时 间 持 续 期 ), 每 日 模式 大 大 地 消减 了 . 


(a) (b) 


40 3.2 

3.0 

g” Eos 
E * 
地 te 

$ F26 
x 20 "i 

24 

10 2.2 

20 

0 10 20 30 4050 607080 0 1020 304050 G0 70 SO 
5 分 钟 的 区 间 5 区 间 


E| 5-6 IBM 从 1990 年 11 月 1 日 到 1991 年 1 月 31 日 的 交易 数据 : (a) 每 5 分 钟 时 间 
间隔 的 平均 持续 期 , (b) 对 确定 成 分 调整 之 后 的 每 5 分 钟 的 平均 持续 期 
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5.5.1 ACD 模型 


自 回归 条 件 持续 期 (ACD) 模型 利用 GARCH 模型 的 思想 来 研究 方程 (5.31) 中 
调整 的 时 间 持 续 期 At; 的 动态 结 爸 . 为 了 记号 的 简便 , 我 们 定义 z; = At 

令 pi = E(r|F; i) 表示 第 i 一 1 次 交易 至 第 1 次 交易 的 调整 的 时 间 持 续 期 的 
条 件 期 望 , 其 中 EL, 为 第 i 一 1 次 交易 时 可 以 得 到 的 信息 集合 . 换 句 话说 , uv, 为 给 
XE Fii 的 条 件 上 期 望 的 调整 持续 期 . 基本 的 ACD 模型 定义 为 


wi = Yici, (5.33) 


其 中 f{e;} 是 独立 同 分布 的 非 负 随机 变量 序列 满足 Elei) = 1. 在 Engle 和 Russell 
(1998) 中 , si 服从 一 个 标准 指数 分 布 或 者 是 标准 化 的 韦 布 尔 (Weibull) 分 布 , 并 且 
v; 假定 为 以 下 形式 


r 5 
V =w -+ S yti + So Pi— j. (5.34) 
j=l ja 


这 样 一 个 模型 可 以 称 为 ACD(r, s) 模型 . 当 = 服从 一 个 标准 指数 分 布 时 , 结果 中 的 
模型 称 为 BACD(r, s) 模型 . 类 似 地 , 如 果 e, 服从 标准 化 的 韦 布尔 (Weibull) 分 布 ， 
WEKA WACD(r, s) 模型 . 有 必要 的 话 , 读者 可 以 参考 附录 A, 对 指数 分 布 与 韦 布尔 
分 布 进行 一 个 一 个 快速 的 回顾 . 
与 GARCH 模型 类 似 , 过 程 n; = zi; — v; 是 一 个 蒜 差 序列 [ 即 E(n|F; 1) = 0], 
ACD 模型 可 以 写 为 
max(r,s) 


t; = ú+ >t (55 + w;) aij -XMen- ag Eis (5.35) 
j=) 


这 正好 是 没有 高 斯 新 息 的 ARMA 过 程 的 形式 . 此 处 , 对 于 j > noy; = 0; 对 于 
j>s, wj=0. 可 以 用 这 样 的 表示 来 得 到 ACD 模型 弱 平稳 性 的 基本 条 件 . 例如 , 对 
方程 (5.35) 两 边 取 期 望 , 并 且 假 定 弱 平 稳 性 , 则 我 们 有 


E(xi) = 


w 
1 On (Yi + wj) 
因为 期 望 持续 期 是 正 数 , 所 以 我 们 假定 w > 0, 1 Y: (y +w). 作为 方程 (5.35) 的 
另外 一 个 应 用 , 我 们 研究 一 下 EACDO A) 模型 的 性 质 
EACD(1,1) 模型 
一 个 EACD(1,1) 模型 可 以 写 为 


B= iE, Pi =w + Tti- Hwy (5.36) 


其 中 e; 服从 标准 指数 分 布 . 利用 附录 A 中 标准 化 指数 分 布 的 矩 , 我 们 有 
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E(e;)=1, Var(e;)=1, E(e?) = Var(e;) + [E(e;)? = 2. 


假定 v, 是 弱 平 稳 的 (也 就 是 说 z; AVS PATA BEST [8] 2840), 那么 我 们 可 以 导出 
zi 的 方差 . 首先 对 方程 (5.36) 两 端 取 期 望 , 我 们 有 


E(r;)- E[E(wis;|Fi-:1) = E(vw;)  E(vi)-—uw--7jE(ri-1)--wi1E(wi-i). (5.37) 


在 弱 平 稳 性 的 条 件 下 , Elti) = E(v; 1), 因此 方程 (5.37) 给 出 


Ww 


He = E(ri) = E(vi) = (5.38) 


1—753-—wi 
又 因为 Ele?) = 2, 我 们 有 
E(z;) = E(E(p7e?|Fi-1)| = 2E(v/?). 


在 方程 (5.36) 中 对 v, 的 平方 取 期 望 , 并 且 利用 vi 和 zz; 的 弱 平 稳 性 质 , 通过 某 些 
代数 运算 , 得 到 

1— (m +41)? 
1—242 — w? —2q1u5 ^ 


最 后 , 利用 Var(zi) 一 E(z2) 一 [E(z;)]?, E(a?) = 2E(2), 我 们 有 


E(wi)= hz x (5.39) 


1 — w? 一 27iwi 
其 中 uu 如 方程 (5.38) 中 定义 . 这 个 结果 显示 , 为 了 得 到 时 间 不 变 的 无 条 件 方差, 方 
程 (5.36) 中 的 EACD(1,1) 模型 必须 满足 1 > 23? +w? +2y1wi. WACD(1,1) 模型 
的 方差 可 以 利用 同样 的 方法 以 及 标准 化 韦 布尔 分 布 的 前 两 阶 矩 得 到 . 
带 有 广义 伽 玛 分 布 的 ACD 模型 


在 统计 文献 中 , 强度 函数 经 常 根据 危险 率 函 数 来 表示 .， 正 如 附录 B 中 所 示 ， 
EACD 模型 的 危险 率 函 数 随时 间 不 变 , 而 WACD 模型 的 危险 率 函 数 是 一 个 单调 函 
数 . 这 些 危 险 率 函 数 在 实际 应 用 中 相当 受 限制 , 因为 股票 交易 的 强度 函数 可 能 不 固 
XE, 或 者 不 随时 间 单 调 变 化 . 为 了 增加 相应 的 危险 率 函数 的 灵活 性 , Zhang, Russell 
和 Tsay (2001) 对 si 采用 了 一 个 (标准 化 的 ) 广义 伽 玛 分 布 . 对 于 广义 伽 玛 分 布 的 
基本 性 质 可 以 参见 附录 A. 结果 中 的 危险 率 函 数 可 以 假定 不 同 的 模式 , 包括 U 型 或 
者 倒转 的 U 型 . 我 们 将 新 息 服 从 广义 伽 玛 分 布 的 ACD 模型 称 为 GACD(r, s) 模型 . 


5.5.2 ”模拟 
为 了 说 明 ACD 过 程 , 我 们 利用 e; 的 两 种 不 同 的 新 息 分 布 , 从 ACD OL) 模型 


Var(zi) = 2E(U?) — u$ = p? x 


Tj = ViEj, Pi — 0.8 - 0.2741 4-0. TV .1 (5.40) 
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中 产生 了 500 个 观测 值 . 在 第 一 种 情形 中 , 假定 s 服从 参数 a = 1.5 的 标准 化 的 韦 
布尔 分 布 ; 在 第 二 种 情形 中 , 假定 e; 服从 参数 k= 1.5, a= 0.5 的 一 个 (标准 化 的 ) 
广义 伽 玛 分 布 . 

图 5-7a 给 出 了 WACD(1,1) 序列 的 时 间 图 , 图 5-8a 为 GACD(1,1) 序列 的 时 间 
图 . 图 5-9 描绘 出 了 两 个 模拟 序列 的 直方 图 . 两 个 模型 的 区 别 是 很 显然 的 . 最 后 , 在 
图 5-10a 与 图 5-11b 中 , 我 们 分 别 给 出 了 两 个 模拟 序列 的 样本 ACF, 从 中 可 以 清楚 
地 看 到 序列 的 相依 性 . 


(a) 模拟 的 WACD(1, 1) 序 列 


EE 8 
RK 1 
X 4 

2 

0 

0 100 200 300 AUU 500 
时 间 指 数 
(b) 标准 化 的 残 差 


0 100 200 300 400 500 
时 间 指 数 


图 5.7 由 (5.40) 式 模拟 的 WACD(1,1) 序列 : (a) 原始 序列 : 
(b) 估计 后 的 标准 化 序列 . 共有 500 个 观测 什 


(a) 模拟 的 GACDT1 DEA 


80 
EE 60 
20 
0 

0 LO 200 300 400 500 

时 间 指 数 
(b) 标准 化 的 残 差 
E 
20 
x 15 
= 10 
1 5 
$ 1 ^ 
0 100 200 300 400 500 


时 间 指 数 
图 5-8 由 (5.40) 式 模拟 的 GACDI(1L1) 序列 : (a) 原始 序列 : 
(b) 估计 后 的 标准 化 序列 . 共有 500 个 观测 值 


202 第 5 章 高 频数 据 分 析 与 市 场 微观 结构 


(a) (b) 
120 


j 300 
100 zT: d 


| 
804 c 
200 
60 
40 | 
100 


prj 
0 20 40 60 80 
T 


图 5-9 具有 500 个 观测 值 的 模拟 的 持续 期 过 程 的 直方 图 : (a) WACD(1,1) 模型 ; 
(b) GACD(1,1) A! 


(a) 原始 序列 


0 5 10 15 20 25 30 
ME 
(b) 标准 化 的 残 差 序列 


0 5 10 15 20 25 30 
间隔 
图 5-10 具有 500 个 观测 值 的 模拟 WACD(1,1) 序列 的 样本 自 相关 函数 : (a) 原始 序列 ; 
(b) 标准 化 残 差 序列 
5.5.3 ”估计 


对 于 ACD(r, 5) 模型 , $ ty = max(r, s), ae = (z1,--- zt) 持续 期 ci,zz，…， T 
的 似 然 函 数 为 


T 

f(zrlg) = | lI fed) x f(zi,|8), 
i=ig+1 

其 中 6 表示 模型 的 参数 向 量 , T 表示 样本 大 小 .前 一 个 方程 中 的 边缘 概率 密度 函 

数 f(zi,19) 对 广义 的 ACD 模型 而 言 相 当 复杂 ， 因 为 它 对 似 然 函数 的 冲击 是 随 着 

样本 大 小 工 的 增加 而 递减 的 , 边缘 密度 通常 忽略 了 这 一 点 , 从 而 导致 了 条 件 似 然 方 
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(a) 原始 序列 


0 5 10 15 20 25 30 


间隔 
(b) 标准 化 的 残 差 序列 


ü 5 10 15 20 25 30 


间隔 
Fl 5-11 具有 500 个 观测 值 的 模拟 GACD(1,1) 序列 的 样本 自 相关 函数 : (a) 原始 序列 ; 
(b) 标准 化 残 差 序列 


法 的 运用 . 对 于 WACD 模型 , 我 们 利用 方程 (5.55) 中 的 概率 密度 函数 (probability 
density function, 简 记 为 pdf) 得 到 条 件 对 数 似 然 函 数 为 


1 a 

Kol, a.) = In|P(1—-—]| -In| — 
^ E» a| ( a E 

7 (1+ i)z 3 

Vi | 
其 中 = w + D yrit D whi 0 = (um, Yr 001, 7 ** 4078 a), 2 = 
(Topi ** €T)". E a=1 时 ， (条 件 ) 对 数 似 然 函 数 简 化 为 EACD(r, s) 人 异型 的 

形式 . 
对 于 一 个 GACD(r, s) 模型 , 条 件 对 数 似 然 函 数 为 


q 


a 
l(z|0, 2,,) = P In (sta) | (wa  1)lIn(z;) — ka ln(Ay,) 一 (总 


(5.41) 


t (5.42) 


其 中 和 = DOO/T («+2 i) 参数 向 量 9 也 包含 s WREAK, 当 x = 


fos AF (ii) 时 , 方程 (5.42) 中 的 对 数 似 然 函数 简化 为 方程 (5.41) 中 模型 

WACD(r, s) 的 似 然 函 数 形式 . 这 个 对 数 似 然 函 数 可 以 改写 为 许多 形式 来 简化 估计 . 
在 某 些 正规 性 条 件 下 , 条 件 最 大 似 然 估计 是 渐 近 正 态 的 , 具体 可 参见 Engle 和 

Russell (1998) 及 其 参考 文献 . 在 实践 中 , 一 旦 指定 了 持续 期 模型 , 对 于 感 兴趣 的 问 

题 可 以 用 模拟 的 方法 得 到 有 限 样本 的 参考 分 布 

例 5.3( 模 拟 的 ACD(1,1) 序列 的 继续 ) ”考虑 方程 (5.40) 中 模拟 的 WACD(1,1) FF 

列 以 及 GACD(1,1) 序列 , 利用 条 件 似 然 方 法 得 到 的 结果 列 于 表 5-6 中 , 估计 看 上 去 
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是 合理 的 , $ 必 表示 vy 的 1 步 向 前 预测 , 5; = zi /六 为 标准 化 的 序列 . 可 以 认为 
是 序列 标准 化 的 残 差 . 如 果 模 型 已 充分 确定 , (6,} 应 该 以 独立 同 分 布 随机 变量 的 形 
式 运动 . 图 5-7b 与 图 5-8b 显示 了 两 个 模型 5; 的 时 间 图 . 拟 合 的 两 个 模型 的 E 的 
ACF 分 别 在 图 5-10b 与 图 5-11b 中 给 出 . 很 显然 在 £ 序列 中 没有 发 现 显著 的 序列 
HX. 


X 5-6 对 模拟 的 ACD(1,1) 模型 的 500 个 观测 值 序列 的 估计 结果 : 
(a) WACD(1,1) 序列 ; (b) GACD(1,1) 序列 
WACD(1,1) 模型 


0.3 0.2 


0.100 
(0.025) 


0.3 
0.401 
(0.117) 


j 0.5 1.5 
0.561 0.436 2.077 
(0.078) (0.653) 
例 5.4 ”作为 持续 期 模型 的 说 明 , 我 们 考虑 IBM 股票 从 1990 4E. 11 月 1 日 至 1990 
年 11 月 7 日 连续 5 个 交易 日 内 的 交易 间 的 持续 期 . 集中 于 正 的 交易 持续 期 , 我们 
共有 3 534 个 观测 值 . 另外 , 将 数据 作 了 调整 , 消除 了 方程 (5.32) 中 的 确定 成 分 . 也 
就 是 说 , 我 们 采用 了 方程 (5.31) 中 定义 的 3 534 个 正 的 调整 持续 期 . 
5-12a 给 出 了 1990 年 11 月 的 前 5 个 交易 日 内 调整 的 (下 的 ) 持续 期 . 图 
5-13a 给 出 了 序列 的 样本 ACF. 在 调整 的 持续 期 中 , 还 存在 一 些 序列 相关 性 .我 们 
对 数据 拟 合 一 个 WACD(1,1) 模型 , 得 到 的 模型 为 
T; = YKE Wy = 0.169 + 0.064z, . + 0.8859. 1, (5.43) 


Ü 1000 2000 3000 
序列 


ü 1000 2000 3000 
序列 
图 5-12 在 1990 年 11 月 的 前 5 个 交易 日 交易 的 IBM 股票 持续 期 的 时 间 图 : (a) 调整 的 
序列 ; (b) WACD(1,1) 模型 的 标准 化 新 息 . 其 中 有 3 534 个 非 零 的 持续 期 数据 
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(a) 调整 的 持续 期 


0 10 20 30 
间隔 
(b) 标准 的 新 息 序列 


0 10 20 30 


图 5-13 E1990 *F 11 月 的 前 5 个 交易 日 交易 的 IBM 股票 调整 持续 期 的 样本 自 相 关 函 数 ; 
(a) 调整 的 序列 ; (b) WACD(1,1) 模型 的 标准 化 新 息 


其 中 {ei} 是 一 个 独立 同 分 布 的 随机 变量 序列 , 服从 参数 G = 0.879(0.012) 的 标准 
化 的 韦 布 尔 分 布 , 这 里 0.012 为 估计 的 标准 差 . 方程 (5.43) 中 估计 的 标准 差分 别 为 
0.039, 0.010 和 0.018. 所 有 估计 的 二 ERAF 4.2, 说 明 估 计 在 1% 水 平 下 是 显著 
的 . 图 5-12b HT & = zi/wWi 的 时 间 图 , 图 5-13b 提供 了 e; 的 样本 ACF. e; 的 
Ljung-Box 统计 量 为 Q(10) = 4.96, Q(20) = 10.75. WA, 标准 化 的 新 息 没有 显著 
的 序列 相关 性. 事实 上 , 平方 序列 (82). 的 样本 自 相 关 性 也 很 小 , 其 Q(10) = 6.20, 
Q(20) = 11.16, 进一步 确认 了 标准 化 的 新 息 之 间 缺 少 序列 相依 性 ， 另 外 ,参数 为 
œ = 0.879 的 标准 化 的 韦 布尔 分 布 的 均值 和 标准 差分 别 为 1.00 和 1.14, 这 些 数字 也 
接近 于 (6) 的 样本 均值 1.01 和 标准 差 1.22. 拟 合 的 模型 看 上 去 是 合适 的 . 

在 模型 (5.43) 中 , 估计 系数 y +w s 0.949, 隐 含 了 调整 持续 期 的 某 种 持续 性 . 
调整 持续 期 的 期 望 为 0.169/(1 一 0.064 一 0.885)=3.31 fb, 这 接近 于 调整 持续 期 的 样本 
均值 3.29. 标准 化 韦 布 尔 分 布 的 形状 参数 的 估计 a 为 0.879, 小 于 1 但 是 接近 于 1. 
因此 , 条 件 危 险 率 函 数 以 缓慢 的 速率 单调 递减 . 

如 果 对 新 息 采 用 广义 gamma 分 布 函数 , 那么 拟 合 的 GACD(1,1) 模型 为 


Tj = Ye, Yi = 0.141 + 0.063z;—1 + 0.897y;_1, (5.44) 


其 中 {ei} 服从 方程 (5.56) KERER Soh, BA — 4.248(1.046) HBR 
a = 0.395(0.053), 括号 内 的 数字 表示 估计 的 标准 误差 . 方程 (5.44) 中 三 个 参数 的 标 
准 误 差分 别 为 0.041, 0.010 和 0.019. 所 有 的 估计 在 1% 水 六 下 都 是 统计 上 显著 的 . 
标准 化 的 新 息 过 程 (2; } 及 其 平方 序列 都 没有 显著 的 序列 相关 . 这 里 = zi/w; 是 根 
据 模型 (5.44) 定义 的 . 具体 来 讲 , 对 于 6; 过 程 , 我 们 有 Q(10) = 4.95, Q(20) = 10.28; 
对 22 序列 , BANA Q(10) = 6.36, Q(20) = 10.89. 
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模型 (5.44) 的 期 望 持 续 期 是 3.52, 稍 高 于 方程 (5.43) 中 WACD(1,1) 模型 的 持 
续 期 . 类 似 地 , 模型 (5.44) 中 的 持续 参数 4 + 0, 也 稍 高 于 0.96. 

注释 : EACD 模型 的 估计 可 以 利用 一 些 带 minor 修改 的 ARCH 模型 的 程序 
REM. 具体 可 参见 Engle 和 Russell(1998). 本 书 用 作者 创建 的 RATS 程序 或 者 
— Fortran 程序 来 估计 持续 期 模型 ， 有 限 的 经 验 表明 估计 一 个 GACD 模型 比 估 
计 一 个 EACD 模型 和 WACD 模型 都 更 困难 . 用 来 估计 WACD 与 GACD 模型 的 
RATS 程序 在 附录 C 中 绘 出. 口 


5.6 ” 非 线性 持续 期 模型 


高 频数 据 中 也 通常 会 发 现 非 线性 性 质 . 作为 说 明 , 我 们 在 例 5.4 中 , 对 IBM 交 
易 的 持续 期 拟 合 的 WACD(1,1) 模型 的 标准 化 新 息 , 利用 第 4 章 中 讨论 的 一 些 非 线 
性 检验 , 可 参见 方程 (5.43). 根据 一 个 AR(4) 模型 , 在 表 5-7 中 的 (a) 部 分 给 出 检 
验 结果 . 正如 从 例 5-4 的 模型 诊断 中 预期 的 , Dri- 检验 显示 标准 化 新 息 中 没有 二 
次 非 线性 性 . 然而 , TAR-F 检验 统计 量 却 显示 了 很 强 的 非 线 性 性 . 


表 5-7 对 TBM 从 1990 年 11 月 1 日 至 1990 年 11 月 7 日 交易 持续 期 的 非 线 性 检验 
类 型 Ori-F TAR-F(1) TAR-F(2) TAR-F(3) TAR-F(4) 
(a) WACD(1,1) 模型 的 正 态 化 新 息 


(b) 门限 WACD(1,1) 模型 的 正 态 化 新 息 


a 愉 利 用 了 日 内 持续 期 . TAR-F 检验 括号 内 的 数 表 示 时 间 延 退 . 


根据 表 5-7 的 检验 结果 , 我 们 对 IBM 的 日 内 持续 期 考虑 一 个 两 体制 的 门限 持 
续 期 模型 (threshold duration model)， 门 限 变 量 为 r，_;( 即 一 步 延 迟 调 整 持续 期 )， 
门限 值 的 估计 为 3.79, 拟 合 的 门限 WACD(1,1) 模型 是 x, 一 wai, 其 中 


| 0.020 + 0.2577;.1 -- 0.847; 1,8; ~ w(0.901), #F ci 的 3.79， 
Ay == 


(5.45) 
1.808 + 0.027241 + 0.501; 1,5; ~ w(0.845), Æ zi > 3.79. 


这 里 w(a) 表示 参数 为 a 的 标准 化 韦 布尔 分 布 . 两 种 体制 下 观测 值 的 数量 分 别 为 
2 503 和 1 030. 在 方程 (5.45) 中 , 第 一 个 体制 中 参数 的 标准 误差 分 别 为 0.043, 0.041, 
0.024 和 0.014; 而 第 一 个 体制 中 参数 的 标准 差分 别 为 0.526, 0.020, 0.147 和 0.020. 
考虑 方程 (5.45) 表示 的 门限 WACD(1,1) 模型 的 标准 化 新 息 6; = c/o. 得 到 
& AY Q(12) = 9.8, Q(24) = 23.9; €? 的 Q(12) = 8.0, Q(24) = 16.7. XXE, & 序列 与 
et 序列 之 间 均 无 显著 的 序列 相关 性 . f EL, 对 这 个 新 的 标准 化 新 息 序列 £, 应 用 前 
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面 同样 的 非 线性 检验 , 我 们 没有 检验 出 非 线 性 , 结果 见 表 5-7(b) 部 分 . 因此 , 方程 
(5.45) 中 的 两 体制 WACD(1,1) 模型 是 合适 的 . 

如 果 我 们 将 两 体制 分 为 大 量 交易 与 很 少 交易 两 个 时 期 , 那么 对 IBM 股票 , 门 
限 模 型 显示 , 由 日 内 交易 持续 期 度量 的 交易 动态 性 在 大 量 交 易 与 很 少 交 易 两 个 时 期 
是 不 同 的 (即使 在 日 内 模式 调整 之 后 ). 这 并 不 令 人 惊奇 , 因为 市 场 活动 经 常 是 新 的 
信息 和 其 他 信息 的 到 达 驱 动 的 . 

方程 (5.45) 估计 出 的 门限 WACD(1,1) 模型 包含 一 些 不 显著 的 参数 , 我 们 将 模 
型 提炼 得 到 如 下 结果 


0.225zi_1 + 0.8675; 1,6; ~ w(0.902), 2$ 21 < 3.79, 
1.618 + 0.61441, €i ~ w(0.846), d zi > 3.79. 


提炼 出 的 模型 的 参数 估计 都 是 高 度 显著 的 . 标准 化 的 新 息 5 = zi/W 的 L-B 统计 
量 显示 Q(10) = 5.91(0.82), Q(20) = 16.04(0.71); €? 的 L-B 统计 量 显 示 Q(10) = 
5.35(0.87), Q(20) = 15.20(0.76), 这 里 括号 内 的 数字 是 p 值 . 因此 , 提炼 出 的 模型 是 
合适 的 . 用 来 估计 前 述 模型 的 RATS 程序 在 附录 C 中 给 出 ， 


5.7 ”价格 变化 和 持续 期 的 二 元 模型 


本 节 引 入 一 个 考虑 了 价格 变化 和 相应 持续 期 的 联合 过 程 的 模型 . 如 前 所 述 , VF 
多 股票 的 日 内 交易 是 无 价格 变化 的 、 那 些 交 易 与 交易 强度 高 度 相关 , 但 它们 不 包含 
关于 价格 运动 的 直接 信息 . 因此 , 为 了 简化 价格 变化 建 模 中 的 复杂 性 , 我 们 集中 讨 
论 导 致 价格 变化 的 交易 , 并 考虑 同时 描述 价格 变化 和 相应 时 间 持 续 期 的 多 元 动态 性 
的 价格 变化 与 持续 期 (price change and duration, 简称 为 PCD) 模型 . 

继续 利用 5.6 节 中 记号 , 但 是 定义 改 为 价格 变化 的 交易 . A ti 是 资产 在 第 i 次 
价格 变化 的 日 历时 间 . 同 前 面 一 样 , t; 是 从 一 个 交易 日 的 午夜 开始 以 秒 为 单位 测量 
的 . 令 已, 表示 第 i 次 价格 发 生变 化 时 的 交易 价格 , Ati = ti — ti 是 价格 变化 的 
时 间 持 续 期 . 另外 , 令 Ni 表示 时 间 间 隔 (t_1,t) 中 无 价格 变化 时 的 交易 数量 . 这 
个 新 变量 被 用 来 表示 无 价格 变化 期 间 的 交易 强度 . 最 后 , 令 Di 表示 第 i 次 价格 变 
化 的 方向 . 当 价 格 上 升 时 , Di = 1; 当 价 格 下 降 时 , Di = —1. > S, 表示 以 最 小 价位 
变动 单位 测量 的 第 i 次 变化 的 大 小 . 在 新 的 定义 下 , 股票 价格 随时 间 的 变化 为 


Pi, = 1 + DiS;. (5.46) 

对 第 i 次 价格 变化 的 人 交易 数据 包括 {At Ni, Di, Si}. PCD 模型 关心 的 是 对 (Ati, Ni, 
Di, Si) 的 联合 分 析 . 

注释 : 集中 于 与 价格 变化 相 联系 的 交易 可 以 大 大 地 降低 样本 的 大 小 . 例如 , Æ 

Š IBM 股票 从 1990 年 1 月 1 日 至 1991 年 1 月 31 目的 日 内 数据 , 共有 60 265 
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个 日 内 交易 , 但 是 它们 中 只 有 19 022 个 引起 了 价格 变化 . 另外 , 价格 变化 的 时 间 持 

续 期 中 没有 日 内 模式 . 口 
为 了 解释 所 有 交易 的 价格 运动 与 只 跟 价格 变化 相关 的 交易 的 价格 运动 之 间 的 

KA, 我 们 考虑 IBM 股票 在 1990 年 11 月 21 日 的 日 内 交易 . 在 这 一 天 的 正常 交易 

时 间 , 有 726 个 交易 , 只 有 195 个 交易 引起 了 价格 变化 . 图 5-14 显示 了 两 种 情况 下 

价格 序列 的 时 间 图 . 正如 所 预期 的 , 价格 序列 是 相同 的 . 


(a) 所 有 交易 
114.0 
113.5 
S 113.0 
112.5 | 
35 000 — 40 000 — 45 mo 50 000 —— 55 000 
(b) 导致 价格 变化 的 交易 
114.0 
at 113.5 
车 113.0 
112.5 


35 000 40 000 45 000 50 000 55 000 


图 5-14 IBM 股票 在 1990 年 11 月 21 日 的 日 内 交易 价格 的 时 间 图 : 
(a) 所 有 交易 ; (b) 导致 价格 变化 的 交易 


在 给 定 Fii 的 条 件 下 , PCD 模型 将 (Ati, Ni, Di, S) 的 联合 分 布 分 解 为 


f (Ati, Ni, Dj, Si|Fi1) 
= f(Si|Di, Ni, Ati, a) f(D Ni, Ati, Fi i) F(Ni Ati, Fi) f(Ati|Fia). — (547) 


这 个 分 解 使 得 我 们 能 够 对 条 件 分 布 指定 合适 的 经 济 计量 模型 ， 从 而 简化 建 模 的 任 
务 . 有 许多 方式 对 条 件 分 布 指定 模型 , 一 个 恰当 的 指定 可 能 依赖 于 所 研究 的 资产 . 
这 里 我 们 采用 McCulloch 和 Tsay (2000) 使 用 的 指定 . 他 们 对 离散 取 值 的 变量 采用 
广义 的 线性 模型 , 对 连续 取 值 的 变量 In(At;) 采用 了 一 个 时 间 序 列 模型 . 

对 价格 变化 之 间 的 时 间 持 续 期 , 我 们 采用 的 模型 为 


In(At;) = Bo + ff In(A£j 4) + PSi_1 + oei, (5.48) 


其 中 o 是 正 数 , {a;} 是 独立 同 分 布 , 服从 N(0, 1) 的 随机 变量 序列 . 这 是 关于 延迟 变 
量 的 多 元 线性 回归 模型 WRA, 可 以 在 模型 中 加 入 其 他 的 解释 变量 . 为 了 确 
保 时 间 持 续 期 为 止 , 我 们 利用 了 对 数 变换 . 

Ni 的 条 件 模型 又 被 进一步 分 解 为 两 部 分 , 因为 经 验 数据 显示 N; 集中 在 0 点 . 
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Ni 模型 的 第 一 部 分 为 logit 模型 
p(N; = 0|At;, Fi-1) = logit[ag + a; In(At;)], (5.49) 
其 中 logit(z) = exp(z)/[1 + exp(a)], 而 模型 的 第 二 部 分 为 


exp[?o + yi In(At,)| 
; - -]1 z 1 A = , 
Ni|(Mi > 0, Ati, Fra) - 31-908), N= + exp[5o 4- 51 In(At,)] 


(5.50) 


其 中 ~ 意思 是 “服从 的 分 布 为 ", gA) 表示 参数 为 ^ 的 几何 分 布 , 即 A 在 区 间 (0, 1) 
上 取 值 . 
方向 D; 的 模型 为 


Dj|(N,, Ati, F, 1) = sign(p HoE); (5.51) 
其 中 = 为 服从 N(0,1) 的 随机 变量 , 而 且 


I = wo wiDii + wa ln(Ati), 
4 

2, Pig 

ja 


HE, D; 是 由 均值 为 pi. 方差 为 o? 的 正 态 随机 变量 控制 的 . 上述 模型 的 特殊 
特征 是 函数 In(o;). 对 于 日 内 交易 , 一 个 关键 的 性 质 是 两 个 连续 价格 变化 之 间 的 价 
格 逆转 . 这 个 性 质 是 通过 在 均值 方程 中 D; 对 D; 的 依赖 允许 o. 为 负 值 来 建 模 
的 . 然而 , 价格 运动 中 存在 很 少 的 局 部 趋势 . 当 过 去 的 数据 呈现 出 局 部 趋势 时 上 
述 的 方差 方程 通过 增加 价格 运动 方向 的 不 确定 性 来 允许 这 样 的 局 部 趋势 存在 于 模 
型 中 . 对 于 一 个 有 固定 均值 的 正 态 分 布 , 增加 方差 使 得 一 个 随机 移动 有 同样 的 机 会 
取 正 值 或 负 值 . 这 又 增加 了 序列 全 部 为 正 的 移动 与 全 部 为 负 的 移动 的 机 会 . 这 样 一 
个 序列 就 产生 了 价格 运动 的 局 部 趋势 . 

为 了 允许 正 负 价 格 运 动 之 间 的 不 同 动态 性 , 我 们 对 价格 变化 的 大 小 采用 不 同 的 
模型 . 具体 来 讲 , 我 们 有 


In(c;) = B 


= B|Di-1 T Di-2 t Di-3 + Di i]. 


S,[(D; = —1, Ni, Ati, Fi-1) ~ p(Aaa) 1 1, In(Aa) 


= 1a,0 + Naa Ni + na ln(Ati) + nd,39i1, (5.52) 
5; |(Di = 1, Ni, Ati, Fi_1) ~ D(Au,i) +1, In(À,,) 
= Thu,0 + Me Ni + 711,2 In( At;) T Tlu,39i—1. (5.53) 


其 中 p(A) 表示 参数 为 和 的 泊 松 分 布 . 在 大 小 中 加 入 1 是 因为 当 价格 变化 时 最 小 的 
大 小 为 1 个 最 小 价位 变动 单位 . 
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方程 (5.48)~(5.53) 中 指定 的 模型 可 以 通过 最 大 似 然 方法 或 MCMC 方法 来 联 
合 估计 . 根据 方程 (5.47), 这 些 模 型 包含 了 6 个 可 以 单独 估计 的 条 件 模型 . 
例 5.5 考虑 IBM 股票 在 1990 年 11 H 21 日 的 日 交易 . 在 正常 的 交易 时 间 有 194 
个 价格 变化 . 图 5-15 给 出 了 In(Ati), Ni, D, 和 S; 的 直方 图 . D, 的 数据 在 “上 升 ” 
与 “下降” 运动 中 大 约 是 平等 分 布 的 . 具有 极 少数 交易 导致 了 大 于 1 个 价位 变动 单 
位 的 价格 变化 . 事实 上 , 有 7 个 具有 2 个 价位 变动 单位 的 变化 ; 有 1 个 具有 3 个 价 
位 变动 单位 的 变化 . 利用 MCMC 方法 ( 详 见 第 12 章 ), 我 们 对 数据 得 到 下 面 的 模 
型 .描述 的 估计 及 其 标准 差 是 9 500 次 迭代 中 MCMC 抽取 的 后 验 均值 和 标准 差 . 
价格 变化 的 时 间 持 续 期 模型 为 


In(A£;) = 4.023 + 0.032 In(Ati_1) — 0.0255;_1 + 1.403e;, 


其 中 系数 的 标准 差分 别 为 0.415, 0.073, 0.384 和 0.073. 拟 合 的 模型 显示 在 时 间 持 续 
期 中 没有 动态 相依 性 . 对 变量 N, 我 们 有 


Pr(N, > 0|At;, F; 1) = logit[—0.637 + 1.740 In(At;)], 


其 中 估计 的 标准 差分 别 为 0.238 和 0.248. ROPE, 在 时 间 间 隔 (5.3.2) 上 无 价格 变 
化 的 交易 数量 正 向 依赖 于 间隔 的 长 度 . 当 Ni > 0 时 , 其 大 小 为 


exp[0.178 — 0.910 In(At,)| 
Ni: > 0, Ati, Fi) ~ 1 (MALE A 
IN. > 0, 1) ~ 1+ gl) I + exp[0.178 — 0.910 In(At,)] 


其 中 估计 的 标准 差分 别 为 0.246 和 0.138. In(At;) 的 显著 的 负 系 数 意味 着 N; 与 持 
续 期 At; 的 长 度 是 正 相 关 的 . 因为 大 的 In(At;) 预示 着 一 个 小 的 A, 从 而 隐 含 了 N; 
以 更 高 的 概率 取 大 的 值 . 可 以 参见 方程 (5.27) 中 的 几何 分 布 . 
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图 5-15 IBM 股票 在 1990 年 11 A 21 日 的 日 内 交易 数据 的 直方 图 : (a) 价格 变化 间 的 
对 数 持续 期 ; (b) 价格 变动 的 方向 ; (c) 以 最 小 变动 价位 测量 的 价格 变化 的 大 小 ; 
(d) 无 价格 变化 的 交易 个 数 
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对 D; 拟 合 的 模型 为 
Hi = 0.049 — 0.840D;.., — 0.004 ln(At;), 
In(aj) = 0.244 |Di 4 + Di 24- Dj; 3 + Di.4|, 


其 中 均值 方程 中 参数 的 标准 差分 别 为 0.129, 0.132 和 0.082, 而 方差 方程 中 参数 的 标 
准 差 为 0.182. 价格 逆转 可 以 从 D, , 的 高 度 显著 的 负 系 数 中 清楚 地 显示 出 来 . 方 
差 方程 的 边际 显著 参数 也 正好 是 所 期 望 的 . 最 后 , 对 价格 变化 大 小 的 拟 合 模型 为 


In(Aa,i) = 1.024 — 0.327 N; + 0.412 In(A£;) — 4.478; 4, 
In(À,,;) = —3.683 — 1.542NN; + 0.419 In(At;) + 0.9215,_1, 


其 中 “下 降 大 小 ” 参数 的 标准 差分 别 为 3.350, 0.319, 0.599 和 3.188, 而 “上 升天 小 * 
的 参数 的 标准 差分 别 为 1.734, 0.976, 0.453 和 1.459. 上 述 两 个 方程 令 人 感 兴趣 的 地 
方 是 Ni 的 系数 的 估计 值 为 负数 . 个 大 Ni 意味 着 在 时 间 间 隔 (655,6) 中 有 更 多 
的 交易 没有 价格 变化 , 这 可 以 看 作 是 时 间 间 隔 (t;_1,t;) 中 没有 可 以 利用 的 新 信息 
的 证 据 . 因此 , t; 时 刻 价 格 变化 的 大 小 应 该 比较 小 . 泊 松 分 布 中 的 小 Nu, 与 Ay; 精 
确 地 说 明了 这 一 点 . 

总 之 , 假定 给 定 某 天 的 194 个 观测 值 样本 可 能 不 包含 关于 IBM 股票 交易 动 
态 的 充分 信息 , 但 是 拟 合 的 模型 看 上 去 提供 了 一 些 合理 的 结果 . McCulloch 和 Tsay 
(2000) 把 PCD 模型 扩展 到 一 个 分 级 结构 框架 , 来 处 理 从 1990 年 11 月 1 日 至 1991 
年 1 月 31 日 之 间 的 所 有 63 个 交易 日 的 数据 . 有 超过 19 000 个 观测 值 , 许多 参数 
估计 在 这 个 扩展 模型 中 都 是 显著 的 . 例如 , 在 时 间 持 续 期 模型 中 , In (Az; ) 的 系数 
的 全 部 估计 从 0.04 到 0.1 变化 . 尽管 这 种 变化 比较 小 但 是 很 显著 . 

最 后 , 利用 交易 数据 来 检验 微观 结构 理论 通常 需要 仔细 地 指定 所 用 变量 . 它 也 
要 求 对 市 场 运作 的 方式 与 数据 收集 有 更 深刻 的 理解 . 然而 , 本 章 中 讨论 的 计量 经 济 
模型 的 思想 很 有 用 , 并 且 它 已 在 高 频数 据 分 析 中 得 到 广泛 应 用 . 
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指数 分 布 


称 随 机 变量 X 服从 参数 为 (0 > 0) 的 指数 分 布 , 如 果 其 概率 密度 函数 (prob- 
ability density function, 以 下 简 记 为 pdf) 由 下 式 给 出 


1-2/6, dS «>0, 
f(z]g) - 4 9 
0, F r«0. 
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这 样 一 个 分 布 表示 为 X ~ exp(B). 我 们 有 E(X) = 8, Var(X) = 8. X 的 累积 分 布 
mat (Cumulative distribution function, 以 下 简称 为 cdf) 为 


0, E r«0, 


F(x|f1) ad 1—e7 2/8, 车 a> 0. 


"4 8 — 1 时 , a X 服从 标准 指数 分 布 . 
伽 玛 函数 
对 于 && 0, fS T(K) 定义 为 


Dis) = | ate Fda. 
0 


伽 玛 函 数 最 重要 的 性 质 为 : 
(1) 对 任意 的 上 > 1, P(x) = (& — 1)P(« — 1); 
(2) 对 任何 正 整 数值 m, (m) = (m —1)!; 
(3) T(#) = VT. 
积分 Y 
l(yl&) = | ve tdr; y»0 


是 一 个 不 完全 的 仰 玛 函数 , 它 的 值 在 文献 中 已 用 表 列 出 . 估计 不 完全 伽 玛 函数 的 计 
算 机 程序 现在 也 是 可 以 得 到 的 . 

4n 32 5) Ap 

称 随机 变量 X 服从 参数 为 上 和 He > 0,8 > 0) 的 伽 玛 分 布 , 如 果 其 pdf 由 下 
式 给 出 


SE E gs 
f(z|s. 8) = | BT (K) | WP 30, 
9, E r«c0. 

通过 变量 代 换 y = 0/3, 可 以 很 容易 得 到 X ROME: 

1 oc 
are |, 
pmT(e 十 网 

T(x) 


gtm- le 一 z/Bdr 


E(X") = [. z" f (z|&, 8)dz = 


特别 地 , X 的 均值 、 方 差分 别 为 E(X) = Kp, Var(X) = 467. 24 8 — 1 时 , 该 分 布 称 
为 一 个 参数 为 « 的 标准 伽 玛 分 布 . 利用 记号 G ~ gamma(k) 表示 G 服从 一 个 参数 
An 的 标准 伽 玛 分 布 . G HANMER 

= T(x +m) 


E(G"") Ts) 


m > 0. (5.54) 
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PERAN 


称 一 个 随机 变量 X 服从 参数 为 a、B(a > 0,8 > 0) 的 韦 布尔 分 布 , 如 果 其 pdf 
为 


部 2 一 Le 一 (z/ 有) X ox > 0, 
0, F r«0, 
这 里 8 和 a 分 别 为 分 布 的 尺度 参数 和 形状 参数 . X 的 均值 、 方 差分 别 为 


E(X) = 8r (142). vant) - fr (12) " F3] 


X 的 edf 为 


f(zla, 8) -1 Be 


0, 4 2r<0, 
I= e C/A. 345 4239. 


当 a =1 时 , 韦 布尔 分 布 简化 为 指数 分 布 . 
E X Y = X/[8U(1 + 3). 我 们 有 EY) — 1, 而 且 Y 的 pdf 为 


nen or (1+2)] ee Fera} 者 y>0, 555) 
0, 


* y « 0, 


F(r|a, 8) = | 


这 里 由 于 标准 化 , 所 以 尺度 参数 消失 了 . 标准 化 的 韦 布尔 分 布 的 edt 为 
0, S y«0, 
F(yla) = 1—exp{-|r(1+2) a dí y»0. 
并 且 我 们 有 E(Y) = 1, Var(Y) 2 (14 2)/Ir (1 -- /a)]? — 1. 对 于 带 韦 布尔 分 布 新 息 
的 持续 期 模型 , 最 大 似 然 估计 中 利用 的 就 是 上 述 的 pdf 
广义 伽 玛 分 布 


称 随机 变量 X 服从 参数 为 w, B, kla 0,9 > 0.6 > 0) 的 广义 伽 玛 分 布 , 如 果 
它 的 pdf H FAH 


arta] AN 
fla.) e | reris" |- (5) |, # z>0 
a 其 他 , 
其 中 8 是 尺度 参数 , a, A 为 形状 参数 . 这 个 分 布 可 以 写 为 
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这 里 G 是 参数 为 s 的 标准 伽 玛 随机 变量 . X 的 pdf 可 以 通过 变量 代 换 的 方法 由 G 
得 到 . 类 似 地 , x 的 矩 可 以 从 方程 (5.54) 中 G 的 矩 得 到 . 
mile I) PT(k 十 m) 


E(X™) = F((aGUe)n| = B™E(G™!/*) = gn n^ = —T(9) 


M4 = 1 时 , 广义 伽 玛 分 布 简化 为 韦 布尔 分 布 . 这 样 , 指数 分 布 和 韦 布尔 分 布 
都 是 广义 伽 玛 分 布 的 特殊 情况 . 
广义 伽 玛 分 布 的 期 望 为 (X) = BT(n +) 在 持续 期 模型 中 , 我 们 需要 
一 个 带 单位 期 望 的 分 布 . 因此 , 定义 随机 变量 Y = 和 AX/B, 这 里 A — P()/T( + $), 
WA E(Y) =1, Y 的 pdf 为 
a kce—1 a 
no-| xT (a) ee [-(5) b # voe (5.56) 
0, 其 他 ， 


这 里 p 仍然 是 尺度 参数 , 入 = r(&)/T(4- 1). 


附录 B 危险 率 函 数 


对 持续 期 建 模 时 一 个 有 用 的 概念 是 由 分 布 函数 隐 含 的 危险 率 函 数 . 对 随机 变 
E X, 生存 函数 定义 为 


Sla) = P(X >z)=1— P(X <2) =1-cdf(r), 90, 


这 给 出 了 服从 X 分 布 的 每 个 事物 在 时 刻 t 生存 的 概率 . X 的 危险 率 函 数 (或 强度 函 
数 ) 定义 为 


I (5.57) 


其 中 f(-) 和 SC) 分 别 是 X 的 pdf 和 生存 函数 . 
例 5.6 ”对 于 参数 为 a、B 的 韦 布尔 分 布 , 生存 函数 与 危险 率 函数 分 别 为 

S(zla, 8) = exp |- (5) | , Mala p) = gor s r > 0， 
特别 地 , 当 a = 1 时 , 我 们 有 hlel) = 1/8. 因此 , 对 于 指数 分 布 而 言 , 其 危险 率 函 
数 是 常数 , 对 于 韦 布 尔 分 布 , 危险 率 函 数 是 单调 的 . WR a > 1, 那么 危险 率 函 数 是 
单调 递增 的 , 如 果 a < 1, 那么 危险 率 函 数 是 单调 递减 的 . 对 广义 伽 玛 分 布 , 生存 函 
数 以 及 和 危险 率 函 数 都 涉及 不 完全 伽 玛 函数 ， 然 而 危险 率 函 数 可 以 有 各 种 不 同 的 形 


状 , 包括 U 型 以 及 倒 U 型 . 这 样 , 广义 伽 玛 分 布 提供 了 对 股票 交易 的 持续 期 建 模 的 
一 个 灵活 方法 . 
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对 标准 化 的 韦 布 尔 分 布 , 生存 函数 以 及 危险 率 函 数 为 


sue) -ef EC 和 


h(y|a) =a Ir (1 + z)| we. y > 0. 


附录 C 对 持续 期 模型 的 一 些 RATS 程序 


运用 的 数据 是 IBM 股票 从 1990 年 11 H 1 H8 11 月 9 日 每 日 交易 的 调整 后 
的 时 间 持 续 期 . 文件 名 为 ibmlt05.txt, 共有 3 534 个 观测 . 


估计 WACD(1,1) 模型 的 程序 


all 0 3534:1 

open data ibmlto5.txt 

data(org-obs) / x r1 

set psi - 1.0 

nonlin a0 al bl al 

frml gvar = aQ+al*x(t-1)+b1*psi (t-1) 

frml gma = %LNGAMMA(1.0+1.0/al) 

frml gln =al*gma(t)+log(al)-log(x(t)) S 
*al*log(x(t)/(psi(t)-gvar(t)))- (exp(gma(t) ) *x(t) /psi(t))**al 

smpl 2 3534 

compute a0 = 0.2, al = 0.1, bl = 0.1, al = 0.8 

maximize (method-bhhh,recursive,iterations-150) gin 

set fv = gvar(t) 

set resid - x(t)/fv(t) 

set residsq - resid(t)*resid(t) 

cor (qstats,number=20,span=10) resid 

cor (qstats,number=20, span=10) residsq 


估计 GACD(1,1) 模型 的 程序 


all 0 3534:1 

open data ibmlto5.txt 

data(org-obs) / x ri 

set psi - 1.0 

nonlin a0 al bl al ka 

frml cv = a0«al*x(t-1)-«bli*psi(t-1) 

frml gma = $&LNGAMMA (ka) 

frml lam exp (gma (t) ) /exp (*LNGAMMA (ka+ (1.0/a1))) 

frml xlam = x(t)/(lam(t)*(psi(t)scv(t))) 

trml gin --gma(t)«log(al/x(t))-^«ka*al*log(xlam(t))- (xlam(t))**al 
smpl 2 3534 

compute a0 = 0.238, al = 0.075, bl = 0.857, al = 0.5, ka = 4.0 
nlpar (criterion=value, cvcrit=0.00001) 

maximize (method=bhhh, recursive, iterations=150) gln 
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set fv = cv(t) 

set resid = x(t)/fv(t) 

set residsq = resid(t) *resid(t) 

cor (qstats,number=20,span=10) resid 
cor(qstats,number=20,span=10) residsq 


估计 门限 一 WACD(1,) 模型 的 程序 


指定 的 门限 为 3.79 
all 0 3534:1 
open data ibmito5,txt 
data(org-obs) / x rt 
set psi - 1.0 
nonlin al a2 al b0 b2 bl 
frml u = ((x(t-1)-3.79)/abs(x(t-1)-3.79) 41.0) /2.0 
frml cpl = al*x(t-1)+a2*psi(t-1) 
frml gmal = %LNGAMMA(1.0+1.0/al) 
frml cp2 = b0«b2*psi(t-1) 
frml gma2 = *LNGAMMA(1.0+1.0/b1) 
frml cp = cpl(t)*(1-u(t))+cp2(t) *u(t) 
frml gln1 =al*gmal(t)+log(al)-log(x(t)) $ 


«al*log (x(t)/(psi(t)scp(t)))- (exp(ama1 (t) ) *x(t) /psi(t))**al 
frml gln2 =bl*gma2(t)+log(bl)-log(x(t)) $ 
+bl*log (x(t) / (psi(t)=cp(t)))- (exp(gma2 (t) ) *x(t) /psi(t))**b1 


frml gln - glni(t)*(1 u(t))*gln2(t)*u(t) 

smpl 2 3534 

compute al - 0.2, a2 - 0.85, al - 0.9 

compute b0 = 1.8, b2 = 0.5, bl = 0.8 

maximize (method-bhhh,recursive,iterations-150) gln 
set fv = cp(t) 

set resid - x(t)/fv(t) 

set residsq - resid(t)*resid(t) 
cor(qstats,number-20,span-10) resid 
cor(qstats,number-20,5pan-10) residsq 


练 2] 题 


5.1 4 r 为 资产 在 上 时刻 的 对 数 收益 率 . 假定 {rt} 是 均值 为 0.05、 方 差 为 1.5 的 高 斯 白 品 
ys. 还 假定 在 每 个 时 间 点 交易 发 生 的 概率 为 40%, 并 且 交 易 是 否 发 生 与 re 独立 , 用 re: 
示 观 测 到 的 收益 率 . fel n? 是 序列 相关 的 吗 ? 如 果 回 答 是 肯定 的 , 请 计算 r? 的 前 3 步 延 
US AFA RA. 

5.2 $ P, 是 观测 到 的 资产 的 市 场 价格 , 它 通过 方程 (5.9) 与 资产 的 基本 价值 Pr 相 联系 . 假定 
AP; = Pr 一 Pn 是 一 个 均值 为 0、 方差 为 1.0 的 高 斯 白 噪声 序列 , 并 假定 买卖 报价 差 为 
2 个 最 小 变动 价位 . 问 : 当 最 小 变动 价位 是 1/8 美元 时 , 价格 变化 序列 AP, = Pi — Pa 
的 一 步 延迟 自 相 关系 数 是 多 少 ? 当 最 小 变动 价位 是 1/16 美元 时 , 价格 变化 的 一 步 延迟 自 
相关 系数 是 多 少 ? 

5.3 文件 ibm-d2-dur.txt 包 含 了 IBM 股票 1990 年 11 月 2 日 交易 之 间 调 整 的 持续 期 . 这 个 


5.4 


5.5 


5.6 


5. 


N 


5.8 
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文件 有 3 列 , 含有 天 、 从 午夜 开始 以 秒 测量 的 交易 时 刻 以 及 调整 持续 期 . 

(a) 对 调整 持续 期 建立 一 个 EACD 模型 , 并 检验 拟 合 的 模型 . 

(b) 对 调整 持续 期 建立 一 个 WACD 模型 , 并 检验 拟 合 的 模型 . 

(c) 对 调整 持续 期 建立 一 个 GACD 模型 , 并 检验 拟 合 的 模型 ， 

(d) 比较 前 面 的 3 个 持续 期 模型 ， 

文件 mmm9912-dtp.txt 包 含 了 3M 公司 的 股票 在 1999 年 12 月 的 交易 数据 有 3 列 : 这 

个 月 的 天 、 从 午夜 开始 以 秒 测 量 的 交易 时 刻 、 交易 价格 . 排除 了 东部 时 间 4:00. 以 后 发 生 的 

交易 . 

(a) 3M 股票 交易 具有 日 模式 吗 ? 你 可 以 购 造 一 个 时 间 序 列 ma, 用 它 表 示 每 5 分 钟 时 间 间 
隔 内 的 交易 数量 来 回答 这 个 问题 . 

(b) 利用 价格 序列 来 确认 3M 股票 的 日 内 交易 中 买卖 报价 弹性 的 存在 性 . 

(c) 以 最 小 变动 价位 1/16 美元 的 倍数 将 价格 变化 的 频率 列表 . 你 可 以 将 变化 为 最 小 变动 
价位 的 5 倍 或 超过 5 倍 的 分 成 一 类 , 变化 为 最 小 变动 价位 的 -5 倍 或 超出 -5 售 的 
作为 男 一 类 . 

再 次 考虑 3M 股票 在 1999 年 12 月 的 交易 数据 

(a) 利用 此 数据 构造 日 内 每 5 分 钟 的 对 数 收 益 率 序列 , 利用 每 5 分 钟 间隔 内 所 有 交易 价 
格 的 简单 平均 作为 这 个 间隔 的 股票 价格 . 问 : 此 序列 是 序列 相关 的 吗 ? 你 可 以 利用 样 
本 自 相关 函数 的 前 10 步 延 迟 值 的 Ljung-Box 统计 量 来 检验 这 个 假设 . 

(b) 在 正常 的 交易 日 共有 77 个 每 5 分 钟 收益 率 . 某 些 研究 者 建议 可 以 用 日 内 的 每 5 分 钟 
收益 率 的 平方 和 作为 日 波动 率 的 一 个 度量 . 采用 这 个 方法 , 并 计算 3M 股票 在 1999 
年 32 月 的 对 数 收益 率 的 日 波动 率 . 讨论 用 这 样 的 方法 来 估计 日 波动 率 的 有 效 性 . 

文件 mmm 9912-adur .txt 包 含 了 3M 股票 在 1999 年 12 月 调整 的 日 交易 持续 期 . 在 一 个 

交易 日 内 有 39 个 每 10 分 钟 的 时 间 间 隔 . 令 d; 为 1999 年 12 月 所 有 的 交易 日 内 第 i 个 

10 分 钟 间隔 的 所 有 对 数 持续 期 的 半 均 . 定义 调整 的 持续 期 为 好 /expf(di), HP j 是 在 第 i 

个 10 分 钟 间隔 内 . 注意 到 更 多 的 方法 可 以 用 米 调整 交易 持续 期 的 日 内 模式 ， 这 里 我 们 仅 

仅 使 用 局 部 平均 . 

(a) 在 调整 的 持续 期 序列 中 有 日 模式 吗 ? 为 什么 ? 

(b) 利用 指数 新 息 对 调整 的 序列 构造 一 个 持续 期 模型 并 检验 拟 合 的 模型 . 

(c) 利用 韦 布尔 分 布 对 调整 的 序列 构造 一 个 持续 期 模型 并 检验 拟 合 的 模型 . 

(d) 利用 广义 伽 玛 分 布 调整 的 序列 构造 一 个 持续 期 模型 并 检验 拟 合 的 模型 ， 

(e) 比较 并 评论 前 面 构造 的 3 个 持续 期 模型 

为 了 得 到 分 析 高 频 金融 数据 的 经 验 , 考虑 GE 股票 从 2003 年 12 月 1 日 到 12 月 5 日 的 

交易 数据 , 该 数据 包含 在 文件 taq-t-ge-dec5.txt 中 . 文件 有 4 大 列 : 日 期 , 时 间 (小 时 ， 

分 钟 , 秒 ), 价格 和 交易 量 . 忽略 正常 交易 时 间 之 外 的 交易 ( 即 东方 时 间 上 午 9: 30 到 下 午 

4: 00), 对 于 每 隔 5 分 钟 交易 的 数量 建立 一 个 时 间 序 列 . 在 所 构建 的 时 间 序 列 中 有 每 日 特征 

吗 ?为 回答 该 问题 , 你 可 以 简单 计算 序列 的 样本 ACR. 交易 数量 在 文件 taq-ge-dec5-nt.txt. 

再 次 考虑 GE 股票 从 2003 年 12 月 1 日 到 12 月 5 日 的 交易 数据 , 忽略 正常 交易 时 间 

之 外 的 交易 . 构建 日 内 每 隔 5 分 钟 交易 的 收益 率 序列 . 注意 到 5 分 钟 时 间 间 隔 (例如 从 

9: 30 到 9: 35) 的 股票 价格 为 该 时 间 间 隔 内 最 后 一 次 交易 的 价格 . 为 简便 , 忽略 隔夜 收益 

率 . 每 隔 5 分 钟 的 收益 率 序列 有 序列 相关 性 吗 ? 用 延迟 为 10 的 ACF 和 5% 的 显著 性 水 
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平 进 行 检验 . 参见 文件 taq-ge-dec5-5m.txt. 
5.9 考虑 习题 5.8 中 同样 的 问题 , 但 是 用 每 10 分 钟 间隔 的 数据 . 参见 文件 taq-ge-dec5-1om. 


txt 


5.10 再 次 考虑 GE 股票 的 高 频数 据 , 忽略 正常 交易 时 间 之 外 的 交易 . 计算 样本 中 两 个 连续 交易 
没有 价格 变化 的 百分比 . 
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金融 资产 的 价格 随时 间 变 化 , 形成 一 个 随机 过 程 . 随机 过 程 是 用 来 描述 一 个 随 
机 变量 随时 间 变 化 的 统计 术 诸 . 观测 到 的 价格 是 随机 过 程 的 一 个 实现 . 随机 过 程 的 
理论 是 对 观测 到 的 价格 进行 分 析 和 作出 统计 推断 的 基础 . 

有 两 种 随机 过 程 模型 可 用 来 对 资产 价格 建 模 . 第 一 种 称 为 离散 时 间 随 机 过 程 . 
其 中 价格 变化 发 生 在 离散 的 时 间 点 上 . 前 面 章节 讨论 的 过 程 都 属于 此 类 型 ， 例 如 ， 
纽约 证 券 交易 所 IBM 股票 的 日 收盘 价 就 组 成 了 一 个 离散 时 间 的 随机 过 程 , 这 里 价 
格 只 在 一 个 交易 日 的 收盘 时 刻 发 生变 化 .一 个 交易 日 内 的 价格 运动 不 一 定 与 观测 
到 的 日 价格 有 关 . 第 二 种 类 型 是 连续 时 间 的 随机 过 程 , 尽管 价格 只 在 离散 时 间 点 上 
可 以 观测 到 , 但 价格 变化 是 连续 的 . 可 以 将 价格 认为 是 股票 的 “真实 价值 ` 它 总 是 
存在 而 且 是 时 变 的 . 

对 两 种 类 型 的 随机 过 程 , 价格 可 以 是 连续 的 或 者 离散 的 . 一 个 连续 的 价格 可 以 
假定 为 任何 正 实数 , 而 一 个 离散 价格 只 能 假定 为 其 可 能 取 值 构成 的 一 个 可 数 集合 . 
假定 资产 价格 是 一 个 连续 时 间 的 随机 过 程 . 如 果 价 格 是 一 个 连续 的 随机 变量 , 那么 
就 有 一 个 连续 时 间 的 连续 过 程 . 如 果 价 格 本 身 是 离散 的 , 那么 我 们 有 一 个 连续 时 间 
的 离散 过 程 . 对 于 离散 时 间 过程 也 可 以 有 类 似 的 分 类 . 第 5 章 中 的 价格 变化 序列 是 
离散 时 间 的 离散 过 程 的 一 个 例子 . 

本 章 将 资产 价格 看 作 是 一 个 连续 时 间 的 连续 随机 过 程 ， 我 们 的 目 的 是 引入 对 
金融 资产 和 价格 运动 建 模 需 要 的 统计 理论 和 工具 . 本 章 的 开始 将 介绍 本 章 中 使 用 
的 一 些 股票 期 权 的 技术 . 在 6.2 节 ， 我 们 对 布朗 运动 (Brownian motion) (也 称 为 维 
纳 过 程 (Wiener process)) 作 一 个 简要 的 介绍 . 然后 我 们 讨论 了 一 些 扩散 方程 以 及 
随机 方程 , 包括 著名 的 伊 芯 引 型 (Tto lemma)j， 大 多 数 期 权 定价 公式 是 在 资产 价格 
服从 一 个 扩散 方程 的 假设 下 推导 出 来 的 . 我 们 利用 Black-Scholes 公式 (以 下 简称 
为 B-S 公式 ) 来 表示 这 种 推导 . 最 后 , 为 了 处 理 稀 有 事件 (比如 一 个 利润 警告 ) 引起 
的 价格 变化 , 我 们 也 研究 了 一 些 简单 的 带 跳 跃 的 扩散 模型 . 

如 果 资 产 价格 服从 一 个 扩散 方程 , 那么 附 随 于 资产 的 期 权 价格 可 以 利用 对 冲 
(hedging) 方法 推导 出 来 . 然而 , 有 跳跃 的 时 候 , 市 场 将 变 得 不 完全 从 而 不 存在 完全 
的 期 权 对 冲 . 此 时 期 权 的 价格 或 者 利用 跳跃 风险 的 分 散 性 来 估价 , 或 者 定义 一 个 风 
险 的 度量 , 然后 选择 一 个 价格 和 对 冲 来 最 小 化 这 个 风险 . 对 于 随机 过 程 在 衍生 产品 
定价 过 程 中 的 基本 应 用 , 参见 Cox 和 Rubinstein(1985) 以 及 Hull (2002). 
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6.1 期 i 


股票 期 权 是 一 个 金融 契约 . 它 赋 予 持 有 者 在 特定 的 日 期 、 以 一 个 指定 的 价格 
交易 一 个 指定 的 普通 股票 特定 份额 的 权利 . 它 有 两 种 类 型 . 看 涨 期 权 赋 予 持 有 者 买 
某 种 标的 资产 的 权利 , 其 正式 的 定义 见 第 3 章 . 看 跌 期 权 赋予 持 有 者 卖 某 种 标的 资 
产 的 权利 . 契约 中 指定 的 价格 称 为 敲定 价格 或 执行 价格 . 契约 规定 的 日 期 称 为 到 期 
日 或 截至 日 . 美式 期 权 可 以 在 到 期 日 之 前 的 任何 时 刻 执 行 , 欧式 期 权 只 能 在 到 期 日 
执行 . 

股票 期 权 的 价值 依赖 于 标的 资产 的 价值 . 令 KK 表示 项 定价 格 , P 是 股价 . 看 涨 
期 权 当 P > K 时 , 赚钱 ; C04 P — K 时, 不 赔 不 赚 ; 当 已 < K 时 , 赔钱 . 看 跌 期 权 当 
P < K 时 , 赚钱 ; 当 忆 = 天 时 , 不 赔 不 赚 ; 当 P > K 时 , 赔钱 . 一 般 而 言 , 一 个 期 权 
如 果 立 即 执 行将 对 持 有 者 导致 正 的 现金 流 时 则 是 赚钱 的 ， 期 权 如 果 立 即 执行 将 对 
股票 持 有 者 导致 负 现金 流 时 则 是 赔钱 的 . 最 后 , 期 权 如 果 立 即 执行 将 导 丝 0 现金 流 
时 是 不 赔 不 赚 的 . 显然 , 只 有 赚钱 的 期 权 在 实际 中 才 会 被 执行 ， 要 得 到 更 多 关于 期 
权 的 信息 , 参见 Hull (2002). 
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在 数理 统计 中 , 连续 时 间 的 连续 随机 过 程 定义 在 一 个 概率 空间 (N, F, P) E, 其 
中 o 是 非 空空 间 , F 是 一 个 包含 O 的 所 有 子 集 的 o- dX, P 是 概率 测度 . 具体 可 
参见 Billingsley (1986) 的 第 1 章 . 过 程 可 以 写 为 ((n, 0], 其 中 t 表示 时 间 并 且 在 
[0, 00) 上 连续 . 对 于 给 定 的 1, eln, t) 是 一 个 实 值 连续 随机 变量 ( 即 从 9 到 实 直线 上 
的 一 个 映射 ), 7 是 9 的 元 素 . 对 于 资产 在 时 刻 t 的 价格 , elt) 的 取 值 范围 是 非 负 
实数 集 . 对 于 一 个 给 定 的 n {a(n 0) 是 一 个 时 间 序 列 , 其 值 依赖 于 时 刻 t+. 为 了 简 
便 , 我 们 将 连续 时 间 随 机 过 程 写 为 {zu}. 可 以 将 其 理解 为 , 对 于 给 定 的 re 是 一 个 
随机 变量 . 在 文献 中 , 一 些 作者 为 了 强调 t 是 连续 的 , 运用 z(t) 来 代替 rz. 然而 我 
们 利用 相同 的 记号 nu, 但 是 称 它 为 一 个 连续 时 间 随 机 过 程 . 


6.2.1 MEE 


在 离散 时 间 经 济 计 量 模型 中 , 我 们 假定 “抖动 ”形成 一 个 白 品 声 过 程 (White 
noise process), 它 是 不 可 预测 的 . 连续 时 间 模 型 中 “抖动 ”的 对 应 部 分 是 什么 ? 答 
案 是 一 个 维 纳 过 程 (也 称 为 标准 布朗 运动 ) 的 增 量 ， 有 很 多 方式 定义 一 个 维 纳 过 程 
{wt}. 我 们 利用 与 在 时 间 上 的 小 增 量 At 相关 的 小 变化 Aw, = wep ar — we 的 一 个 
简单 方法 . 一 个 连续 时 间 随 机 过 程 (us) 是 一 个 维 纳 过 程 , 如 果 它 满足 : 

(1) Aux = =VE 其 中 上 是 一 个 标准 正 态 随 机 变量 ; 

(2) Aus 与 w; 独立 , 对 于 所 有 的 « t. 
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第 二 个 条 件 是 一 个 马尔 可 夫 性 , 说 明 在 当前 值 w 的 条 件 下 , 该 过 程 过 去 的 任何 新 
息 wlj <t) JHR wull > 0) 是 不 相关 的 . 由 这 个 性 质 很 容易 看 出 , 对 任意 
两 个 不 相交 的 时 间 段 Al 与 Ao, 增 量 wi, a, 一 wi 与 增 量 wa, — ur, 是 独立 的 . 
在 金融 中 , 这 个 马尔 科 夫 性 与 弱 式 有 效 市 场 是 相关 的 . 

由 第 一 个 条 件 ，Axw， 是 均值 为 0、 方 差 为 At 的 正 态 分 布 . HR, Aw, ~ 
N(0, At), 这 里 ~ 表示 概率 分 布 . 下 面 考虑 过 程 wy. 我 们 假定 过 程 开始 于 t — 0, 初 
始 值 为 wo, 这 个 值 是 固定 的 , 而 且 通 常设 定 为 0. 从 而 wi — wo 可 以 看 作 是 许多 微 
小 增 量 的 和 . 更 具体 地 讲 , 定义 人 = 去 , 这 里 At 为 一 个 很 小 的 正 增 量 , 则 


U, — Wo = WsAr — Wo = 3 Aw; = 3 EiV A 


i=l i=] 


其 中 Aw; = WiAt — V(i1)AL 因为 诸 Ei 是 独立 的 ， 所 以 我 们 有 


T 
E(we—wo)=0, Var(w, — wo) = >》 At = TAt — t. 
这 样 , we 从 0 时 刻 到 t 时 刻 的 增 量 是 均值 为 0、 方差 为 + 的 正 态 分 布 . 规范 地 表示 
为 , 对 于 维 纳 过 程 w, 我 们 有 wi — wo ~ N(0,t). 这 说 明 一 个 维 纳 过 程 的 方差 随 带 
有 时 间 区 间 长 度 的 线性 性 质 而 增加 ， 

图 6-1 给 出 的 是 单位 时 间 区 间 [0, 1) 上 4 个 模拟 的 维 纳 过 程 . 它们 由 在 统计 学 
文献 中 的 Donsker 定理 的 一 个 简单 形式 (参见 Donsker (1951) 或 Bilingsley (1968)) 
得 到 , 取 n=3 000. 这 四 幅 图 都 开始 于 wo = 0, 但 是 当时 间 递 增 时 漂移 分 开 , 说 明 维 
纳 过 程 的 方差 随时 间 递 增 . 可 以 用 一 个 从 [0,1] 到 [0, oc] 的 一 个 简单 的 时 间 变 换 来 
得 到 te [0, ccl 上 模拟 的 维 纳 过 程 . 


0.6 0.5 
n4 0.0 
= 0.2 (0.5 
= 0.0 P 
—]1.0 
—0.4 -—155 
0.0 0.2 04 06 08 1.0 0.00.22 04 0.6 08 1.0 
Tt] fa] 时 间 
0.4 
0.2 0.2 
3.02 3 0.0 
—0.6 —0.4 
0.0 02 04 06 08 10 0.0 0.2 04 06 08 10 
时 间 


图 6-1 4 个 模拟 的 维 纳 过 程 
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Dousker 定理 

假定 {4} 是 一 个 相互 独立 的 标准 正 态 随机 变量 的 序列 . 对 十 任意 t E [0,1]. 
令 [nt] 表示 nt 的 整数 部 分 . 定义 ut = 去 时 as 则 当 n RATER, wn 依 分 
布 收敛 到 一 个 在 [0,1] 区 间 上 的 维 纳 过 程 w. 

产生 维 纳 过 程 的 S-Plus 命令 

n = 300 

epsi = rnorm(n, 0,1) 

w = cumsum (epsi)/sqrt (n) 

plot (w, type=’1’) 

注释 1: 概率 空间 (Q FP). 上 的 一 个 布朗 运动 wi 的 正式 定义 为 ; HF 20, 
它 是 一 个 具有 独立 平稳 增 量 的 实 值 连续 随机 过 程 . RVG, w 满足 

(1) 连续 性 : 从 + 到 wi 的 映射 关于 概率 测度 P 几乎 处 处 连续 ; 

(2) 独立 增 量 : wRs<t, WATIA GI v <s, uw, ws 与 wy 独立 ; 

(3) 平稳 增 量 : 如 果 s <t uw, ws 与 wi-_s 一 to 具有 同样 的 概率 分 布 ， 
可 以 说 明 增 量 w- w, 的 概率 分 布 是 均值 为 u(t— s). 27 E29 (t-s) 的 正 态 分 布 . 
而 且 , 对 于 任意 给 定 的 时 间 指 标 0 < £1 < ta «o < te, 随机 向 量 (wn wes iwi) 
服从 一 个 多 元 正 态 分 布 . 最 后 , 如 果 wy = 0 几乎 处 处 成 立 , p= 0 Bor? — 1, AH 
朗 运动 是 标准 的 . 口 

注释 2: 布朗 运动 的 一 个 重要 性 质 是 它们 的 路 径 几 乎 处 处 不 可 微 . 换 句 话说 ， 
对 一 个 标准 布朗 运动 wi, 对 于 Q 中 除了 满足 P(A) = 0 HFRS QC 以 外 的 
所 有 元 素 diwi/dt 都 是 不 存在 的 . 因此 , 当 考 虑 资产 的 时 间 价值 时 , 我 们 不 能 运用 通 
常 的 积分 求 和 米 处 理 涉及 一 个 标准 布朗 运动 的 积分 , 必须 寻求 另外 一 种 方法 . 这 就 
是 下 一 节 中 讨论 伊 膝 积分 的 目的 . 口 


6.2.2 ”广义 维 纳 过 程 


维 纳 过 程 是 一 个 特殊 的 随机 过 程 : 具有 0 漂移 率 以 及 有 与 时 间 间 隔 的 长 度 成 
比例 的 方差 . 这 意味 着 期 望 的 变化 率 为 0 而 方差 的 变化 率 为 1. 在 实践 中 , 随机 过 
程 的 均值 和 方差 可 以 以 一 种 更 加 复杂 的 方式 随时 间 演 变 , 因此 需要 随机 过 程 的 进 一 
步 一 般 化 . 为 了 这 个 目的 , 我 们 考虑 期 望 漂移 率 为 p, 方差 变化 率 为 o? 的 广义 维 纳 
过 程 . 将 这 个 过 程 用 zt 来 表示 , 并 且 用 记号 dy 表示 变量 y 的 一 个 微小 变化 , 则 zt 
的 模型 为 

dx, = pdt + odw:, (6.1) 


其 中 uw, 是 一 个 维 纳 过 程 . 如 果 我 们 考虑 方程 (6.1) 的 离散 形式 , 那么 对 于 从 0 F t 
的 增 量 为 


te 一 了 0 一 ut + oevt. 
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因此 ， 
E(r,— zo)- ut, Var(z,— xo) = ot. 


结果 说 明 zt 的 增 量 对 期 望 的 增长 率 为 u, XS ZEEE o. 在 文献 中 , 方程 
(6.1) 中 的 pS o 称 为 广义 维 纳 过 程 zt 的 漂移 参数 和 波动 率 参 数 . 


6.2.3 FRO 


广义 维 纳 过 程 的 漂移 参数 和 波动 率 参数 都 不 随时 间 变 化 .如 果 进 一 步 扩 展 模 
型 , AW u A 是 随机 过 程 xz 的 函数 , 那么 我 们 就 有 了 一 个 伊 膝 过 程 . 具体 来 讲 ， 
过 程 «x, 是 一 个 伊 膝 过 程 , 如 果 它 满足 


dz, = u(z;, t)dt + o(ay, thdwy, (6.2) 


其 中 wi 是 一 个 维 纳 过 程 . 这 个 过 程 在 数理 金融 中 起 着 很 重要 的 作用 , 可 以 写 为 
Ti = To 十 [ 1H(Zs,S)ds + i O (Ts, S)dWs, 
0 0 


其 中 zo 表示 过 程 在 0 时 刻 的 初始 值 , 右面 的 最 后 一 项 是 一 个 随机 积分 . 方程 (6.2) 
称 为 一 个 随机 扩散 方程 , J(zi,t) 和 o(z t) 分 别 是 漂移 函数 和 扩散 函数 . 

维 纳 过 程 是 一 个 特殊 的 伊 芯 过 程 , 因为 它 满足 方程 (6.2) 中 取 (x,t) = 0 B. 
olst) =1 的 情形 . 


6.3 18 Bk 5| X8 


金融 中 利用 连续 时 间 模 型 时 , 通常 假定 资产 的 价格 是 一 个 伊藤 过 程 . 因此 , 为 
了 导出 金融 衍生 资产 的 价格 , 需要 利用 伊 芯 积 分 . 本 节 主 要 回顾 一 下 伊 芯 引 理 , 并 
将 它 看 作 是 微 积 分 中 微分 运算 的 自然 推广 . 伊藤 引 理 是 随机 积分 的 基础 . 


6.3.1 ”微分 回顾 
令 G(r) 表示 x 的 可 微 函 数 . 利用 泰勒 展开 , 我 们 有 


AG = G(x + Az) — G(z) = a Aa $102 


当 Az 一 0 时 取 极 限 , 并 且 忽略 Ac 的 高 阶 项 , 我 们 有 


dG = 22 ds. 


(Ax)? + 


4 GA z Aly 的 函数 时 , 我们 有 


.58 aG 1aa PG 
AG = —Ar+ LL 9,5 35:5 (8 + 3337 


PG 2 十 
Ox Oy Ayk + 


355, A759 53 z( 


224 第 6 章 连续 时 间 模 型 及 其 应 用 
当 Az — 0 H. Ay 0 时 取 极 限 , 我 们 有 


OG OG 
= Ox da + By 9^ 


dG 


6.3.2 ”随机 微分 


下 面 转 到 考虑 G 为 zt 和 上 的 可 微 函数 的 情况 , 其 中 zt 是 一 个 伊 芯 过 程 . 泰 
勒 展 开 变 为 


| 0G 0G LPG ,RG E PTT 
AG = 3 Art a M 9952 M) + 3:5; 2*4 + 375p (At) epson (6.3) 
伊 鹏 过 程 的 离散 形式 为 
Ax = pAt + oe VAt, (6.4) 


这 里 为 了 简便 , RAT Tp Al o 的 变 元 , 并 记 Aw = rear me 由 方程 (6.4), R 
们 有 


(Az)? = n? (At)? 二 ao2g2At 十 210E(At)3/2 = oe2At + H(At), (6.5) 


其 中 五 (Ai) 表示 At 的 高 阶 项 . 这 个 结果 说 明 (Az)? 包含 了 与 At 同 阶 的 项 , 当 我 
们 对 At 一 0 取 极 限时 , 此 项 不 能 忽略 . 然而 , 方程 (6.5) 右面 的 第 一 项 有 一 些 好 的 
性 质 : 


Ele2s2Af) = a7 At, 
Var(a7e7 At) = E[o*e*(At)?] — [E(o7e7 A0)? = 204 (At)?, 


其 中 对 于 标准 正 态 随机 变量 , 我 们 利用 了 Elet) = 3. 这 两 个 性 质 说 明了 0262 At “4 
At 0 时 收敛 到 一 个 非 随机 量 o? Ac 因此 , 由 方程 (6.5), 我 们 有 当 At 一 0 RT, 


(Ax)? — o2dt. 


将 此 结果 代入 方程 (6.3) 中 , 并 且 利 用 方程 (6.2) 中 z BRR, 我 们 得 到 


8G. -3G 18G, 
dG = a, t ar * 3357 dt 
Ba" ot ° 2 LY d be Mts 


TRIE BED LAR DF BB) PRESE 
注意 我 们 在 伊 芯 引 理 的 推导 中 将 变量 (zx,t) 从 漂移 系数 /及 波动 率 系数 o 中 
省 略 了 . 为 了 避免 将 来 有 任何 的 疑惑 , 我 们 将 引 理 重 述 如 下 ， 
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[E SIE: 
假定 c, 是 一 个 连续 时 间 的 随机 过 程 , 满足 
day = u(z,, t)dt + o( xz, t)du,, 
其 中 w 是 一 个 维 纳 过 程 . 另外 , Glen t) 是 zk 和 上 + 的 可 微 函 数 . 那么 


dG = Ez (54 SS a. 25 oot (en) 


ðG 


例 6.1 作为 一 个 简单 的 解释 , 考虑 维 纳 过程 的 平方 函数 G (ws t) =w. 这 里 我 们 
有 (uy, t) = 0, olw t) = 1, WA 


因此 ， 
= (2w x0+0+ E x 2 x 1)dt + 2u,du, = dt + 2u,duy. (6.7) 
6.3.3 ”一 个 应 用 
S 忆 表示 一 只 股票 在 时 刻 4 的 价格 , CE [0,co) 上 连续 . 文献 中 通常 假定 已 
服从 一 个 特殊 的 伊 茧 过 程 
dP, = u P,dt + oP, du, (6.8) 


其 中 与 o 都 是 固定 的 . 利用 方程 (6.2) PRIS, 我 们 有 (ms t) = 
wre, o(ae,t) = ozn 这 里 m, = Ph. 这 样 一 个 特殊 的 过 程 称 为 几何 布朗 运动 ( Geo- 
metric Brownian Motion). 现在 我 们 利用 伊 芯 引 理 来 得 到 针对 股价 已 的 对 数 的 一 
个 连续 时 间 模 型 . > G(P,,t) = In(P,) 表示 标的 股票 的 对 数 价 格 , 则 我 们 有 


DF 1 Ja 18G 1(-1) 


OF: R° 6t ” 200P 2 FP 
因此 , 根据 伊 芯 引 理 , 我 们 得 到 


1 (—1) 3 
2 PP 


1 
din(P,) = (fart 


at 
Fe) dt + p; o Pda, : (^ 一 5) dt + o dus. 


这 个 结果 说 明 如 果 价格 是 一 个 几何 布朗 运动 , 那么 价格 的 对 数 服 从 一 个 一 般 的 维 纳 
WE, 其 漂移 率 为 pp — o? /2, 方差 率 为 o. 因此 , 价格 的 对 数 ( 即 对 数 收益 率 ) 从 当 
前 时 刻 t 到 将 来 某 时 刻 T 的 变化 服从 均值 为 (u—97/2)(T — t). 212578 o7(T — 1t) 
的 正 态 分 布 . 若 时 间 间 隔 T 一 += A 是 固定 的 , 而 且 我 们 更 感 兴趣 于 对 数 价格 的 等 
间隔 的 增 量 , 那么 增 量 序列 就 是 一 个 均值 为 (1 一 o?/2)A、 方差 为 0? ^ 的 高 斯 过 程 . 
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6.3.4 pp Mo 的 估计 


方程 (6.8) 的 几何 布朗 运动 中 的 两 个 未 知 参 数 / 与 o 可 以 用 经 验方 法 来 估 
计 . 假定 我 们 有 股价 P, 在 时 间 间 隔 A( 例 如 日 、 周 或 者 月 ) 上 的 二 十 1 个 观测 值 ， 
可 用 年 来 度量 A. 观测 到 的 价格 表示 为 (P Pi,---. Pa}, 并 且 对 t =1,---,n, 令 
人 一 ]a( 书 ) 一 jn( 忆 -1 

因为 P, = Pr. exp(ri), 其 中 n 是 第 :个 时 间 间 隔 上 的 连续 复合 收益 率 . 利用 
”前 一 小 节 中 的 结果 , 并 且 假 定 股价 P, 服从 一 个 几何 布朗 运动 , 我 们 得 到 rt 服从 均 
值 为 (4 一 o2/2)A、 方差 为 o?A 的 正 态 分 布 . 另外 , re 不 是 序列 相关 的 . 

为 了 简便 , 定义 ur = E(re) = (u — 0? /2)A, o? = Var(ri) = 0? A. 6 r, s, 分 别 
表示 数据 的 样本 均值 和 标准 差 , 即 


ak t € 
s Dee" OO x. (re — r)?. 


n 1—1 
s t—1 


正如 第 1 章 中 提 到 的 , F 5 os 分别 是 r 的 均值 和 标准 差 的 相合 估计 , 即 当 n 一 oc 
时 ,大 一 hj 且 s c 因此 ,我们 可 以 通过 


估计 o. 另外 , 可 以 表明 该 估计 值 的 标准 差 渐 近 于 5/V2n. 由 应 = 元 我 们 可 以 通 
过 下 式 来 估计 u 
网 
oe” SB SA 
当 序 列 r, 是 序列 相关 的 , 或 者 当 资 产 价格 不 服从 方程 (6.8) 中 的 几何 布朗 运动 
时 , 则 必须 运用 其 他 的 估计 方法 来 估计 扩散 方程 的 漂移 参数 和 波动 率 参 数 . 稍 后 我 
们 再 讨论 这 个 问题 . 
例 6.2 考虑 1998 年 IBM 股票 的 日 对 数 收益 率 . 图 6-2a 是 数据 的 时 间 图 , 共有 
252 个 观测 值 . 图 6-2b 描述 了 序列 的 样本 自 相 关 . 可 以 看 出 , 对 数 收益 率 确实 是 前 
后 不 相关 的 . L-B 统计 量 (Ljung-Box statistic) 给 出 了 Q(10) = 4.9, 与 自由 度 为 10 
的 x? 分 布 比较 是 高 度 不 显著 的 . 
如 果 我 们 假定 1998 年 IBM 股票 的 价格 服从 方程 (6.8) 中 的 几何 布朗 运动 , 那 
么 我 们 可 以 利用 日 对 数 收益 率 来 估计 参数 u Alo. HARTA = 0.002 276, 
s, = (0.019 15. 因为 一 个 交易 日 等 价 于 A = 1/252 Æ, 我 们 得 到 


PS 2 
AA 


8r 


VA 
因此 在 1998 4E, IBM 股票 每 年 的 期 望 收 益 率 的 估计 为 61.9896. BRAEZEA 30.496. 


p= 


= 0.3040, ñ= = 0.619 8. 
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ü 50 100 150 200 250 


(b) 


0 5 10 15 20 
图 6-2 1998 年 IBM 股票 的 日 收益 率 : (a) 对 数 收益 率 ; (b) 样本 自 相 关 性 


然而 , 日 对 数 收益 率 的 正 态 性 假定 可 能 并 不 成 立 . 在 这 个 特殊 的 例子 中 , 偏 度 
-0.464(0.153) 和 超额 峰 度 2.396(0.306) 增加 了 某 种 关注 , 这 里 括号 内 的 数字 表示 渐 
例 6.3 考虑 1999 年 Cisco Systems 股票 的 日 对 数 收益 率 , 共有 252 个 观测 值 , FF 
本 均值 和 标准 差分 别 为 0.003 32 和 0.0263 03. 对 数 收 益 率 序列 也 表明 没有 序列 相 
关 性 , Q(12)=10.8 甚至 在 10% 水 平 下 都 是 不 显著 的 . 所 以 , 我 们 有 


> 9. 0.026 303 a Ee 
FE = — = = 0.418, f= — + — = 0.924. 
VA  ,/1.0/252.0 a 


因此 , 1999 年 Cisco Systems 股票 的 年 期 望 收 益 率 的 估计 为 92.496, 标准 差 的 估计 
为 41.8%. 
6.4 股票 价格 与 对 数 收益 率 的 分 布 
6.3 节 的 结果 显示 , 如 果 假 定 一 只 股票 的 价格 服从 几何 布朗 运动 
dP, = uP,dt + oP,diw,, 
那么 价格 的 对 数 服 从 一 般 的 维 纳 过 程 
dln( P,) = (^ 一 T) dt + odir, 


其 中 P, 为 股票 在 t 时 刻 的 价格 , w 是 一 个 维 纳 过 程 . 因此 , 对 数 价格 从 时 刻 土 到 
时 刻 T 的 变化 是 正 态 分 布 的 , 即 
g? 


In(Pr) — m(P;) ~ N (n 5) (r—t),08 (=a). (6.9) 
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因此 , 在 给 定时 刻 t 的 价格 已 的 条 件 下 , T >t 时刻 的 对 数 价格 是 正 态 分 布 的 , 即 
c? - 
In(Pr) ~ N lcm) + (n 一 T) (T —t),o7 (T — | ; (6.10) 
利用 第 1 章 中 讨论 的 对 数 正 态 分 布 的 结果 , 我 们 得 到 Pr 的 (条 件 ) 均值 和 方差 分 
别 为 
E(Pr) = P. exp[u(T — t)], 
Var(Pr) = P? exp[24(T — t)|(explo?(T — t)| — 1}. 
注意 这 个 期 望 确 认 了 po 是 股票 的 期 望 收益 率 . 
股价 的 先 验 分 布 可 以 用 来 作 统计 推断 . 例如 , 假定 股票 A 的 当前 价格 为 50 美 


元 , 股票 的 年 期 望 收益 率 为 15%, 年 波动 率 为 40%, 则 股票 A 在 6 个 月 (0.5 年 ) 内 
的 期 望 价格 和 相应 的 方差 由 下 式 给 出 


E(Pr) = 50exp(0.15 x 0.5) = 53.89, 


Var(Pr) = 2500exp(0.3 x 0.5)[exp[0.16 x 0.5] — 1] = 241.92. 


从 现在 开始 的 6 个 月 内 价格 的 标准 差 为 V241.92 = 15.55. 
Pil, 4 r 表示 从 时 刻 上 到 时 刻 T 中 每 年 的 连续 复合 收益 率 , 则 我 们 有 
Pr = P, exp[r(T — t)], 
其 中 四 和 + 是 以 年 度量 的 . 因此 


herd is 
n=) 
由 方程 (6.9), 我 们 有 


In (=) ~N [(u- 5) T-), r-o]. 


因此 , 每 年 的 连续 复合 收益 率 的 分 布 为 


a? c? 
r~ N (w= Dra) 

所 以 , 连续 复合 收益 率 服 从 均值 为 1 一 0? /2, 标准 差 为 o VT 一 + 的 正 态 分 布 . 

考虑 年 期 望 收 益 率 为 1596, 年 波动 率 为 10% 的 一 支 股 票 . 该 股票 在 两 年 内 的 连 
续 复合 收益 率 的 分 布 是 正 态 的 , 每 年 的 均值 为 0.15—0.01/2=0.145 或 14.596, 标准 
差 为 0.1/V2 = 0.071 或 7.196. 这 些 结 果 允 许 我 们 对 构造 置信 区 间 (confidence 
interval, 以 下 简 记 为 C.L). 例如 ,y 的 每 年 一 个 95% C.I. 为 0.145 士 1.96x0.071 (Hil 
0.6%, 28.4%). 
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6.5 B-S 微分 方程 的 推导 


本 节 利 用 伊 芯 引 理 和 无 套利 假定 , 对 于 价值 为 P 的 股票 的 衍生 未 定 权益 的 价 
格 推导 其 B-S 微分 方程 .假定 价格 P, 服从 方程 (6.8) 中 的 几何 布朗 运动 , 并 且 
Gi = G(Py,0) BAF P, 的 衍生 未 定 权 益 (例如 一 个 看 涨 期 权 ) 的 价格 . 由 伊藤 引 


_ (OC, OG; LPO 4. 8G, 
这 个 过 程 以 及 前 面 结果 的 离散 化 形式 为 
AP, = n PAL -oP Au, (6.11) 
(8G, OO LYON 25 8G, 
AG, = (Fur, + “BE 十 了 aP? [^ P At + OP, wo (6.12) 


其 中 AP, AG, 分 别 为 P, RI G, 在 一 个 小 时 间 区 间 At 上 的 变化 . 因为 对 于 方程 
(6.11) 和 (6.12) 都 有 Aw, = VA, 所 以 可 以 构造 不 涉及 维 纳 过 程 的 股票 与 衍生 次 
产 的 个 组 合 . 恰当 的 组 合 策略 是 卖 空 衍生 资产 并 多 头 持 有 a 的 股份 , 用 Vi 表 
示 组 合 的 价值 . 由 构造 , 可 知 i 


=g 4 9G 

Vi=—Grt gp Pe (6.13) 
则 v, 的 变化 为 - 
— JAM t 

AV, = —AG + FE AM. (6.14) 


将 方程 (6.11) 和 (6.12) 代入 方程 (6.14), 我 们 有 
dd — == ^p) At. (6.15) 
t 


此 方程 并 不 涉及 随机 部 分 Aw, 因此 , 在 无 套利 假设 下 , 组 合 Vi 在 一 个 小 时 间 区 
间 At 上 一 定 是 无 风险 的 . 换 句 话说 , 所 用 的 假设 蕴涵 组 合 一 定 同时 可 以 赚 得 与 其 
他 的 短期 无 风险 证 券 相同 的 收益 ; 否则 , 在 这 个 资产 组 合 与 短期 无 风险 证 券 之 间 就 
存在 套利 机 会 . 因此 , 我 们 有 


AV; = rV At = (rAt)W,, (6.16) 
其 中 r 为 无 风险 利率 . 由 方程 (6.13) 到 方程 (6.16), 我 们 有 


OG, 18?G, 2 2 = 9G, 
(E apr" P At=f Gi- 5p, P At. 
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6G; 1 &G 
9B + 27 P opr =r). (6.17) 
这 就 是 对 衍生 资产 定价 的 B-S 微分 方程 . 可 以 通过 解 此 方程 来 得 到 标的 变量 为 P, 
的 衍生 资产 的 价格 . 

这 样 得 到 的 解 依赖 于 衍生 资产 的 边界 条 件 . 对 一 个 欧式 看 涨 期 权 而 言 , 边界 条 


件 为 


Gr = max(Pr — K,0), 
其 中 r 是 到 期 时 间 , K 是 执行 价格 . 对 于 一 个 欧式 看 跌 期 权 而 言 , 边界 条 件 变 为 
Gr = max(K — Pr,0). 


例 6.4 ”作为 一 个 简单 例子 , 考虑 股票 的 一 个 远 期 合约 , 不 支付 红利 . 在 这 种 情况 
F. 合约 的 价值 由 下 式 给 出 


G, = P, — K exp|-r(T — t)], 


其 中 K 是 交割 价格 (delivery price), r 是 无 风险 利率 , T 为 到 期 日 . 对 于 这 样 的 一 
个 函数 , 我 们 有 


8C, 8G, o?G 
E m —rK exp|—r(T — t)], 8B 1, OPE = 0, 
将 这 些 量 代入 方程 (6.17) 的 左面 得 到 
-rK exp|—r(T —t)] - rP, =r{P, - Kexp[ r(T — 1)]), 


等 于 方程 (6.17) 的 右面 . 因此 这 的 确 满 足 B-S 微分 方程 . 


6.6 B-S 定价 公式 


Black 和 Scholes (1973) 成 功 地 求解 了 方程 (6.17) 中 的 微分 方程 , 并 得 到 了 对 
欧式 看 涨 期 权 与 看 跌 期 权 价 格 的 精确 公式 . 下 面 我 们 利用 金融 中 所 谓 的 风险 中 性 
定价 来 推导 这 些 公 式 . 

6.6.1 风险 中 性 世界 


将 漂移 参数 u 从 B-S 微分 方程 中 去 掉 、 在 金融 中 这 意味 着 此 方程 是 与 风险 偏 
好 独立 的 . 换 句 话说 , 风险 偏好 不 能 影响 这 个 方程 的 解 . 此 性 质 的 一 个 完美 结果 就 
是 能 够 假设 投资 者 是 风险 中 性 的 . 在 一 个 风险 中 性 世界 里 , 我 们 有 如 下 结论 : 

© 所 有 证 券 的 期 望 收益 率 都 是 无 风险 利率 r; 

e 任何 现金 流 的 当前 价值 可 以 通过 将 它 的 期 望 价值 以 无 风险 利率 折 现 得 到 . 
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6.6.2 AR 
在 风险 中 性 世界 里 , 一 个 欧式 看 涨 期 权 在 到 期 日 的 期 望 价 值 为 
E, [max(Pr — K,0)}, 
其 中 E, 表示 在 无 风险 世界 中 的 期 望 价值 . 看 涨 期 权 在 t 时 刻 的 价格 为 
= exp[—r(T' — t)|E. [max(Pr — K,0)]. (6.18) 
然而 , 在 风险 中 性 世界 里 , 我 们 有 y= r, 并 且 由 方程 (6.10), In(Pr) 是 正 态 分 布 的 : 
In(Pr) ~ N [ae B (+ - z) (T —t),c?(T — 2 ; 
4 g( Pr) 表示 Pr 的 概率 密度 函数 , 则 方程 (6.18). 中 看 涨 期 权 的 价格 为 
o = ex-rtr -| (Pr — Kal Pr)APr. 
通过 积分 的 变量 变换 以 及 一 些 代数 计算 (附录 A 中 给 出 详细 推导 ), 我 们 有 
ct = Pi® (h4) — K exp[-r(T — t)]®(h_), (6.19) 


其 中 (xz) 是 标准 正 态 随机 变量 的 积累 分 布 函数 在 x 点 的 值 ， 


In( P,/K) + (r a? /2)(T — t) 
(7 -*wP—* o ^ 
In(P,/K) + (r — o?/2)(T — t) 
cvT —t 

实际 中 , O(c) 可 以 很 容易 地 通过 大 多 数 统计 软件 包 得 到 .另外 一 种 可 供 选择 的 方 
法 , 可 以 运用 附录 R 中 给 出 的 一 个 近似 . 

方程 (6.19) 中 的 B-S 看 涨 期 权 公式 有 一 些 好 的 解释 . 首先 , 如 果 在 到 期 日 执 
行 期 权 , 得 到 了 股票 , 但 我 们 必须 要 支付 敲定 价格 . 这 个 交换 只 有 当期 权 是 赚钱 的 
(Bl Pr > K) 时 才 会 发 生 . 当量 仅 当 Pr > K 时 , 第 一 项 Plh) 是 得 到 股票 的 
当前 价值 ; 当 且 仅 当 Pr > K 时 , 第 二 项 —K exp[-r(T — idh) 是 支付 执行 价格 
的 当前 价值 . 第 二 个 解释 尤其 有 用 .正如 6.5 节 中 B-S 微分 方程 的 推导 中 显示 的 ， 
SO. = ae 是 资产 组 合 中 不 涉及 不 确定 性 和 维 纳 过 程 的 股份 的 数量 . 这 个 量 就 
是 套 期 保值 变易 中 众所周知 的 A. 我 们 知道 e, = PO(hy) + Br, 其 中 Bi 为 投资 于 
资产 组 合 (或 衍生 资产 空头 头寸 ) 中 的 无 风险 债券 的 美元 总 量 . 可 见 从 对 B-S 公式 
的 检查 中 可 以 直接 看 出 B, = —K exp|-r(T — 1) ®(h_). 公式 的 第 一 项 Pdh) 为 
投资 在 股票 上 的 总 量 , 而 第 二 项 K exp[-r(T — tolh) 是 借入 的 总 量 . 


his. = 


h. = —h,.—owT —t. 
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类 似 地 , 我 们 得 到 一 个 欧式 看 跌 期 权 的 价格 为 
pe = K exp|—r(T — t)|®(—h_) — P,9(—h.,). (6.20) 


因为 标准 正 态 分 布 是 关于 它 的 均值 0.0 对 称 的 , 所 以 我 们 有 : 对 任何 x, B(x) = 
1 — (~r). 利用 这 个 性 质 , 我 们 有 更 (一 应 ) = 1— O(hy). 这 样 , 计算 一 个 看 跌 期 权 价 
格 需 要 的 信息 与 计算 看 涨 期 权 价格 所 需要 的 信息 是 相同 的 . 另外 一 个 方法 , 利用 正 
态 分 布 的 对 称 性 , 很 容易 证 明 


pee = K exp[-r(T — t)] — Pi, 


称 之 为 涨 - 跌 平价 公式 , 而 且 可 用 来 从 c 中 得 到 p 涨 - 跌 平价 公式 也 可 以 通过 考 
虑 下 面 两 个 组 合 来 得 到 . 

(1) 组 合 A: 一 个 欧式 看涨 期 权 加 K exp[-r(T — t) 的 现金 . 

(2) AA B: 一 个 欧式 看 跌 期 权 加 一 股 标 的 股票 . 
到 期 公 的 到 期 日 这 两 个 组 合 的 鼻 利 为 


max( Pr, K). 
由 于 期 权 在 到 期 日 才能 执行 , 组 合 必须 与 现价 具有 相等 的 价值 . 这 意味 着 
c+ K exp|-r(T — 0) = pi + Py, 


这 正 是 前 面 所 给 出 的 涨 - 跌 平价 公式 . 
f) 6.5 假设 Intel 股票 的 当前 价格 是 每 股 80 美元 , 年 波动 率 为 o= 20%, 进一步 
假设 年 无 风险 利率 为 8%. 那么 执行 价格 为 90 美元 , MAZE 3 个 月 内 到 期 的 Intel 
的 一 个 欧式 看 涨 期 权 的 价格 是 多 少 ? 
由 假设 , 我 们 有 PP =80, K = 90, T —t = 0.25, o = 0.2, H r= 0.08. 

因此 

In(80/90) + (0.08 + 0.04/2) x 0.25 
- eee = —0.927 8, 
h_ — hy — 0.20.25 = —1.027 8. 


hy 


利用 统计 软件 (例如 Minitab 或 SCA) 或 者 附录 B 中 的 近似 , 我 们 有 
$(—0.927 8) = 0.176 7, (—1.027 8) = 0.152 0. 
因此 , 一 个 欧式 看 涨 期 权 的 价格 为 


c, = $80 币 (一 0.927 8) — $90@(—1.027 8) exp(—0.02) = $0.73. 
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对 看 涨 期 权 的 买 者 而 言 , 只 有 股价 升 高 10.73 美元 时 , 才能 达到 得 失 平 衡 . 
在 相同 的 假设 下 , 一 个 欧式 看 跌 期 权 的 价格 为 


pi = $90 exp(—0.08 x 0.25)®(1.027 8) — $80(0.927 8) = $8.95. 


这 样 , 对 于 看 跌 期 权 的 买 者 而 言 , 股价 可 以 升 高 额外 的 1.05 美元 而 达到 得 失 平 衡 . 
例 6.6 前面 例子 中 的 敲定 价 属 大 大 超出 了 当前 股价 . 一 个 更 现实 的 敲定 价格 是 
si 美元 ， 假 设 前 面 例子 中 其 他 的 条 件 仍然 成 立 , 现在 我 们 有 P, = 80, K = 81, 
r—(0.08, T — t = 0.25, H hy BA 


p, — In(80/81) + (0.08 + 0.04/2) x 0.25 
^ 0.2 /0.25 
h- = h, 一 0.2V0.25 = 0.025 775. 


— 0.125 775, 


利用 附录 B 中 的 近似 , 我 们 有 9(0.125 775) = 0.550 0 和 (0.025 775) = 0.510 3, 则 
一 个 欧式 看 涨 期 权 的 价格 是 


c, = $809(0.125 775) — $81 exp( 一 0.02) 更 (0.025 775) = $3.49. 


对 于 看 涨 期 权 的 买 者 而 言 , 股价 必须 提高 4.49 美元 , 才 得 失 相 等 . 从 另 一 方面 来 讲 ， 
在 同样 假定 下 的 一 个 欧式 看 跌 期 权 的 价格 为 
pi = $81 exp(—0.02)6(—0.025 775) 一 $809(—0.125 775) 
— $81 exp(—0.02) x 0.489 72 — $80 x 0.449 96 = $2.89. 


对 看 跌 期 权 的 买 者 而 言 , 股票 价格 必须 降低 1.89 美元 , 才 得 失 平衡 . 
6.6.3 ”欧式 期 权 的 下 界 


考虑 没有 支付 分 红 的 股票 的 看 涨 期 权 . 可 以 证 明 欧 式 看 涨 期 权 的 价格 满足 
c; > DP, — K exp[—r(T — t)]. 


也 就 是 说 欧式 看 涨 期 权 的 下 界 是 P, — K exp|—r(T —t)|. 考虑 如 下 两 个 组 合 可 以 验 
证 该 结果 : 

(1) 组 合 A: 一 个 欧式 看 涨 期 权 加 K exp|-r(T 一 | 的 现金 . 
对 于 组 合 A, 如 果 将 现金 以 无 风险 利率 进行 投资 , 则 在 T 时 刻 的 现金 数量 为 K. 如 
E Pr OK, 则 工时 刻 执行 期 权 , 组 合 的 价值 为 Pp. 如 果 Pr OK. 则 不 执行 期 权 ， 
组 合 的 价值 为 K. 因此 组 合 的 价值 是 


max(Pp, K). 
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组 合 B 的 价值 在 T 时 刻 是 Pr. 因此 组 合 A 的 价值 要 比 组 合 B 的 价值 大 , 或 至 少 
相同 . 从 而 今天 组 合 A 的 价值 也 要 比 组 合 B 的 价值 要 大 , 即 


c +K exp|-r(T —1) 2 P, or c >P—K exp[-r(T — t)]. 
进一步 , 由 于 c; > 0, 我 们 有 
c, 2 max(P, — K exp|-r(T — t)],0). 
用 类 似 的 方法 可 以 证 明 , 相应 的 欧式 看 跌 期 权 满 足 
p, 2 max(K exp[-r(T — t)] — P,,0). 
例 6.7 假定 P, = $30, K = $28, 年 利率 为 = 696, T —£ — 0.5. 在 这 种 情形 下 ， 
P, — K exp[-r(T — t)] = $[30 — 28 exp(—0.06 x 0.5)] © $2.83. 


假定 股票 的 欧式 看 涨 价格 为 82.50, 这 比 理论 最 小 值 $2.83 要 小 . 套利 者 可 以 买 该 看 
涨 期 权 并 卖 空 股票 , 这 样 便 产 生 了 一 个 新 的 现金 流 $(30 — 2.50) = $27.50. 如 果 以 无 
风险 利率 投资 6 个 月 , 则 $27.50 变 为 $27.50 exp(0.06x0.5) = $28.34. 在 到 期 日 , 如 果 
Pr > $28, 则 套 期 保值 者 执行 期 权 , 并 平 了 空头 头寸 . 他 获 利 8(28.34 — 28) = $0.34. 
男 一 方面 , 如 果 Pr < $28, 套利 者 可 以 从 市 场 直 接 买 股票 平 仓 , 他 甚至 可 以 获得 更 
多 的 利益 . 作为 说 明 , 假定 Pr = $27.00, 则 获 利 将 是 $(28.34 — 27) = $1.34. 


6.6.4 讨论 


由 公式 知 , 一 个 看 涨 或 看 跌 期 权 的 价格 依赖 于 5 个 变量 , 即 当前 的 股价 P. ii 
定价 格 天 、 以 年 度量 的 到 期 日 了 一 人 年 波动 率 o 以 及 年 利率 r. 值得 研究 的 是 这 
5 个 变量 对 期 权 价格 的 影响 . 

1. 边际 效应 

首先 考虑 这 5 个 变量 对 一 个 看 涨 期 权 价格 c. 的 边际 效应 . 边际 效应 的 意思 是 
在 固定 其 他 变量 的 情况 下 改变 其 中 一 个 变量 . 一 个 看 涨 期 权 的 效应 可 以 概括 如 下 . 

(1) 当前 价格 尺 : et 与 In( P.) 正 相 关 . 特别 地 , 当 P, 0 BY, ce 0:24 P, 5 o6 
IY, c, 一 o0. 图 6-3a 解释 了 K = 80, 年 利率 7 = 6%; T — t= 0.25 年 以 及 年 波动 率 
0 = 30% 时 的 效应 . 

(2) Juff f EK: c 与 n(K) 负 相 关 . 具体 来 讲 , 当 K 一 0 时 , e 一 P. 
K => oo 时 c, — 0. 
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(3) 到 期 时 间 : ct 5a T — t 的 相关 性 非常 复杂 , 但 是 通过 将 hu 和 h 写成 
ln(P./K) " (r 4-o?/2)/T 一 t 


= 
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6-3 ”当前 股价 对 期 权 价格 的 边际 效应 , 其 中 K = 80, T — t = 0.25, 0 = 0.3, 

r — 0.06: (a) 看 涨 期 权 ; (b) 看 跌 期 权 
可 得 到 极限 结果 . E P, < K, W (T-t) ORM eG — 0. 3$ P, > K, 则 当 
(T-th-OWe > P K, A" (T-t) »oo FF e > Py. 图 6-4a 显示 的 是 对 三 
种 不 同 的 当前 股价 来 说 , T 一 t 对 c 的 边际 效应 . 固定 的 变量 是 K = 80, r = 0.06 
和 o — 0.3. 实 线 、 点 划 线 以 及 虚线 分 别 对 应 于 P; = 70,80, 90. 
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图 6-4 当前 股价 对 期 权 价格 的 边际 效应 , 其 中 K = 80,0 = 0.3,r = 0.06: (a) 看 涨 期 权 ; 
(b) 看 跌 期 权 . 实 线 、 点 划 线 和 虚线 分 别 表示 当前 的 股价 为 P, = 70, 80, 90 
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(4) Ka Ro: 通过 将 h, MA 改写 成 
p, — WP /K)+r(7 — t) a: 
WT oT —1 2 
I((R/K)--r(T -t) a | — 
VU BC Ouen 
我 们 得 到 (a) 如 果 In(2/K) + r(T — t) < 0, 则 当 o 一 0 时 , e — 0; (b) 如 果 
In(/K) -- r(T —t) 2 0, W & — 0 Bf, c; — P, | Kce-7(T-0; 当 一 oo 时 ， 
ct — P,. Él 6.5a AK — 80, T £ — 0.25, r = 0.06 以 及 书 取 3 个 不 同 值 时 oJ 
cr 的 效应 . 实 线 、 点 划 线 以 及 虚线 分 别 对 应 于 P, = 70,80, 90. 


0.0 0.2 0.4 0,6 0.8 1.0 1.2 


0.0 0.2 0.4 0.6 0.8 1.0 1.2 
波动 率 波动 率 


图 6-5 ”股市 波动 率 对 期 权 价 格 的 边际 效应 , 其 中 K = 80, T — t = 0.25, r = 0.06 : (a) 看 涨 
WAL; (b) 看 跌 期 权 . 实 线 、 点 划 线 和 虚线 分 别 表示 当前 的 股价 为 P, = 70, 80, 90 


(5) 利率 : e, 与 是 正 相 关 的 , WE: 当 一 oa 时 , ci 一 P 

这 5 个 变量 对 一 个 看 跌 期 权 的 边际 效应 可 类 似 得 到 ， 图 6-36、 图 6-4b 和 图 
6-5b 对 所 选择 的 一 些 情况 解释 了 其 效应 

2. 一 些 联 合 效 应 


图 6-6 表明 波动 率 与 敲定 价格 对 一 个 看 涨 期 权 的 联合 效应 , 这 里 其 他 变量 是 固 
定 的 , P, = 80, r = 6%, T —1—0.25. 正如 所 预料 的 , “ERT BRE ALE 
好 低 十 当前 股价 时 , 看 涨 期 权 的 价格 更 高 . 图 6-7 显示 同样 条 件 下 , 对 一 个 看 跌 期 
权 的 效应 . 当 波 动 率 很 高 而 且 逆 定价 格 正好 高 于 当前 的 股价 时 , 看 跌 期 权 的 价格 更 


高 , 而 且 , 图 形 也 说 明了 随 着 波动 率 的 增加 , 敲定 价格 对 看 跌 期 权 价 格 的 效应 将 变 
得 更 加 线性 化 . 
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图 6-7 股市 波动 率 与 敲定 价格 对 看 涨 期 权 的 联合 效应 , 其 中 P, = 80,7 — t = 0.25, r = 0.06 


6.7 ‘FRR SER RE 


在 推导 定价 公式 时 , 一 个 衍生 资产 可 能 是 多 种 证 券 的 未 定 权 益 . 当 这 些 证 券 的 
价格 由 多 因素 驱动 时 , 衍生 资产 的 价格 就 是 几 个 随机 过 程 的 函数 . 利率 期 限 结构 的 
岗 因 子 模型 就 是 二 维 随 机 过 程 的 一 个 例子 . 在 本 节 中 , 我 们 主要 讨论 伊 膝 引 理 在 几 
种 随机 过 程 情 形 下 的 扩展 . 

考虑 一 个 大 维 连 续 时 间 过 程 zt = (£u, oma). 这 里 大 是 一 个 正常 数 , mH. 
zi 是 一 个 连续 时 间 的 随机 过 程 , 且 满 足 


diri 一 py (az dt 十 c (a, dws, pz 1. V E. (6.21) 


其 中 wit 是 一 个 维 纳 过 程 . 可 以 理解 为 漂移 函数 ei (vi) 与 波动 率 函 数 oj (xy) 也 是 
时 间 指 数 t 的 函数 . 为 了 简化 记号 , 我 们 将 了 上 从 变量 中 省 略 . 对 07 7, 维 纳 过 程 wy 
和 wj, 是 不 一 样 的 . 我 们 假定 dwa 与 dwj, 的 相关 系数 是 pij, 这 意味 着 pi; 是 定义 
为 Awa = At 各 Aw, — 6; At 的 两 个 标准 止 态 随 机 安 量 si 和 z=; 间 的 相关 系数 . 


238 第 6 章 连续 时 间 模 型 及 其 应 用 


假设 Gi = Glar t) 是 随机 过 程 zi 与 时 间 t 的 函数 , 则 由 泰勒 展开 得 


方程 (6.21) 的 离散 形式 为 
Ai = pilt) At + oilt) Awa, i=l, k. 


利用 6.3 节 方 程 (6.5) 的 一 个 类 似 的 变量 , 我 们 得 到 


Jim (Acie)? — o?(a,)dt, (6.22) 
jim, Aug Ax jt =f o, (2,)0j (wz) pij dt. (6.23) 


利用 方程 (6.21)—(6.23), 24 At — 0, 取 极 限 , 并 忽略 At 的 高 阶 项 , 则 我 们 有 


a, OG OG 


k- X 
1 
dG; = M» —— uj (x) + —— Bt *32.2.3 RA *3-—5 i (Bt) 075 (Ze) pig | dt 


4 ys Sct o(a) dij. (6.24) 


这 就 是 伊 茧 引 理 对 多 重 随机 过 程 情形 的 一 般 化 . 


6.8 随机 积分 


本 节 主 要 讨论 随机 积分 , 以 便 在 假设 资产 的 价格 服从 一 个 伊藤 过 程 时 可 以 得 到 
该 资产 的 价格 . 我 们 利用 伊 艺 公 式 来 推导 积分 结果 . 对 该 论题 严格 的 处 理 , 读者 可 
以 查阅 随机 积分 的 教科 书 . 首先 , 如 同一 个 确定 函数 的 通常 积分 一 样 , 积分 是 差分 
的 反面 , 因此 , 对 于 一 个 随机 过 程 ce, 下 式 仍然 成 立 : 


t 
| az m — zo. 
0 


具体 来 讲 , 对 维 纳 过 程 w, 因为 wo — 0, 所 以 我 们 有 | dw, — wy FH, 考虑 积分 
| du, . 利用 前 面 的 结果 , 并 取 方程 (6.7) 的 积分 , 我 们 有 


t 
we 二 t+ 十 2| Wsdws, 
0 
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因此 , 
| wdw = 50-9. 
这 不 同 于 通常 的 确定 积分 , 那里 
i ydy = (y? — yo)/2- 
转 到 z, 是 一 个 几何 布朗 运动 的 情况 , BD zt 满足 
dz, = pridt + ordiwt, 
其 中 u, o 是 常数 , o > 0, 见方 程 (6.8). 对 Gle, t) = ln(x.) 利用 伊 芯 引 理 , 我 们 得 
到 


g2 
dln(z:) = (^ — 1) dt + edu. 


2 
取 积 分 , 并 利用 前 面 得 到 的 结果 , 我 们 有 
[sme (+8) e 


In(z;) = In(zo) + (u — o? /2)t + ow, 


因此 


且 
z, = zoexp[(1 — o? /2)t + aw]. 


对 资产 价格 将 记号 rt BOA Pe, 则 我 们 在 假设 价格 服从 一 个 几何 布朗 运动 时 , 对 价 
格 有 一 个 解 . 此 价格 为 


P, = Py exp| (p — a? /2)t + ou). (6.25) 


6.9 ”跳跃 扩散 模型 


经 验 研究 发 现 , 基于 布朗 运动 的 随机 扩散 异型 不 能 解释 资产 收益 率 及 其 衍生 
资产 价格 的 一 些 特征 (例如 , 隐 含 波动 率 的 “波动 率 微笑 ", 见 Bakshi, Cao 和 Chen 
(1997) 及 其 里 面 的 参考 文献 ), 波动 率 微笑 指 的 是 期 权 的 隐 含 波动 率 为 融 定 价格 的 
一 个 凸 函 数 . 嫉 钱 和 赚钱 的 期 权 都 倾向 于 比 不 赔 不 赚 的 期 权 有 更 高 的 隐 含 波动 率 ， 
尤其 在 外 汇市 场 中 . 证 券 期 权 对 波动 率 微笑 的 重视 较 少 . 标准 随机 扩散 模型 的 不 足 
导致 了 其 他 连续 时 间 模 型 的 创建 . 例如 , 许多 文献 已 提出 跳跃 扩散 及 随机 波动 率 模 
型 来 克服 这 种 不 足 ; 见 Merton (1976) # Duffie (1995). 
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股价 的 跳跃 经 常 假定 为 服从 一 个 概率 法 则 , 例如 , 跳跃 可 能 服从 一 个 泊 松 过 程 ， 
它 是 一 个 连续 时 间 的 离散 过 程 . 对 于 给 定 的 时 刻 t, 令 X, 表示 在 时 间 段 [0,4] 上 一 
个 特定 事件 发 生 的 次 数 . 如 果 


Pr(X; =m) = 2 


exp(—At), A290, 


WW X, 就 是 一 个 泊 松 过 程 , 也 就 是 说 , X. 服从 一 个 参数 为 At 的 泊 松 分 布 . 参数 8 
制 了 特定 事件 的 发 生 , 称 之 为 过 程 的 强度 . 正式 的 定义 还 要 求 X, 是 一 个 带 有 左 极 
限 且 右 连续 的 齐 次 马尔 可 夫 过 程 . 

本 节 讨 论 了 Kou (2002) 提出 的 一 个 简单 的 跳跃 扩散 模型 . 这 个 简单 模型 有 几 
个 好 的 性 质 . 模型 降 含 的 收益 率 是 有 尖峰 的 、 关 于 0 点 非 对 称 的 . 此 外 , 模型 可 以 
再 生 波 动 率 微笑 并 对 许多 期 权 的 价格 提供 解析 公式 . 模型 包括 两 部 分 , 第 一 部 分 是 
连续 的 , 服从 一 个 几何 布朗 运动 ; 第 二 部 分 是 一 个 跳跃 过 程 . 跳跃 的 产生 由 一 个 泊 
松 过 程控 制 , 并 且 跳 跃 的 大 小 服从 一 个 双 指 数 分 布 . SP, 表示 资产 在 t 时 刻 的 价 
格 , 简单 的 跳跃 扩散 模型 假定 价格 服从 随机 微分 方程 
x = pdt + a dw, +d $ (Ji = ») ; (6.26) 


$—1 


其 中 w 是 一 个 维 纳 过 程 , w 是 强度 为 和 的 泊 松 过 程 , (J.) 是 独立 同 分 布 的 非 负 随 
机 变量 序列 , 满足 X = In(J) 服从 双重 指数 分 布 , 而 且 概率 密度 函数 为 


1 
fx(x) = p m 0«n« 1. (6.27) 


双重 指数 分 布 又 称 为 Laplacian 分 布 . 在 模型 (6.26) 中 , ne, wi 和 Ji 是 相互 独立 的 ， 
以 至 模型 的 随机 性 之 间 没 有 关系 , 注意 到 n. 是 时 间 间 隔 [0, 上 发 生 跳 跃 的 次 数 ， 
并 服从 参数 为 At 的 泊 松 分 布 , 其 中 是 一 个 常数 . 在 第 i 次 跳跃 中 , 价格 跳跃 的 比 
A J; — 1. 

双 指 数 分 布 可 写 为 


= | $ 以 概率 0.5, (6.28) 


其 中 & 是 均值 为 n. 方差 为 1? 的 指数 随机 变量 . 的 概率 密度 函数 为 
j= 26. DE gem: 


双 指 数 分 布 的 一 些 有 用 性 质 为 


E(X)—«, Var(X)—25, E(e*) = 


1 一 ?2 
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对 于 有 限 样本 , 很 难 区 别 双 指数 分 布 与 t 分 布 . 然而 , 双 指数 分 布 在 解析 上 更 易于 处 
理 , 并 且 可 以 产生 一 个 在 均值 周围 的 更 高 的 概率 集中 度 (例如 更 高 峰 ). 正如 第 1 章 
所 述 的 , 观测 到 的 收益 率 的 直方 图 倾向 于 比 正 态 密 度 有 更 高 的 峰 . 图 6-8 用 实 线 表 
示 了 双 指 数 随 机 变量 的 概率 密度 函数 , 虚线 是 一 个 正 态 随机 变量 的 概率 密度 函数 . 
两 个 变量 的 均值 都 是 0、 方差 为 0.000 8. 从 图 6-8 中 可 以 很 清楚 看 到 双 指数 密度 的 
mu. 


一 0.2 一 0.1 0.0 0.1 0.2 
工 


图 6-8 ”均值 为 0、 方差 为 0.000 8 的 双 指 数 随 机 变量 和 正 态 随机 变量 的 概率 密度 函数 ， 
实 线 是 双 指 数 分 布 


解 方程 (6.26) 的 随机 微分 方程 , 我 们 得 到 资产 价格 的 动态 规律 


ne 
P, = Pj exp| (u — 0? /2)t + oun] II Ji; (6.29) 


i=1 


这 里 可 以 理解 为 I = 1. 这 个 结果 是 方程 (6.25) 包含 随机 跳跃 时 的 一 般 化 . 可 以 


如 下 得 到 . 令 & 表示 第 i 次 跳跃 的 时 间 . 对 于 te (0, t1), 没有 跳跃 而 且 价格 可 以 由 
方程 (6.25) 给 出 . 因此 , 左面 价格 在 时 刻 记 时 的 极限 为 


P,- = Poexp|(u — 0° /2)ti + ow]. 
在 时 刻 ty, 价格 跳跃 的 比例 为 J, — 1, 使 得 价格 变 为 
Pa = (1+ A - 1)P,- = AP. = Poexp[(u — o° /2)ti + ows] J. 
对 于 te (ti, tz), 区 间 (t,, 4] EREADER, 所 以 
P, = Pr, exp[(u — 0? /2)(t — ti) +o (we — ux, )]. 


代入 Pas 我 们 有 
P, = Pyexpl(u — 0? /2)t + ow] Ar. 
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重复 这 个 方案 , 可 得 到 方程 (6.29). 
由 方程 (6.29), 标的 资产 在 一 个 小 的 时 间 增 量 At 上 的 简单 收益 率 为 


P, At 一 P, 1 hep at 
= exp | z 5°) At + o(un ci 一 wy) 小 Xel =T: 


+ 一 mt 十 1 
这 里 可 以 理解 为 , 一 个 空 集 上 的 和 为 0, HL X; = In(J,). 对 于 一 个 小 At, 我 们 可 以 
利用 近似 ez 51 bm | 27/2, 以 及 6.3 节 讨 论 的 结果 (Aw)? = At, 得 到 


P A P, 1 The+At 1 
t+At— Fe _ i^a 0. 1,2 2 
EE aM RS (^ 97 ) At + o Aw, + dis ha: + 27 (Aw) 
NetArt 
SjAttoeVAt+ X` Xi, 
i=rne+1 


其 中 Aw, = wrjat us, Ac 是 一 个 标准 正 态 随 机 变量 . 

在 泊 松 过 程 的 假设 下 , 在 时 间 间 隔 (t,t + At] 上 有 一 个 跳跃 的 概率 为 At, H 
多 于 一 个 跳跃 的 概率 为 of At), 其 中 o(At) BHR: 如 果 我 们 将 这 一 项 用 At 来 除 , 则 
当 At 趋 于 0 时 , 它 的 值 也 趋 于 0. 因此 , 对 一 个 小 的 At, 忽略 掉 多 个 跳跃 , 我 们 有 


SO guad Aneta, 以 概率 AAt, 
o L3 以 概率 1 一 AAt. 


与 前 面 的 结果 相 结 合 , 可 以 看 出 标的 资产 的 简单 收益 率 的 近似 分 布 可 由 下 式 给 出 
Pro =H, 
P, 


其 中 工 是 伯 努 利 随 机 变量 , H Pr(T = 1) = AAt, Pr(I = 0) = 1— AAt; X 是 方程 
(6.28) 中 定义 的 双 指 数 随机 变量 . 无 跳跃 时 方程 (6.30) 简化 为 一 个 几何 布朗 运动 . 

4 G = pAt + oeVAt & I x X 3E (6.30) 右面 的 随机 变量 , 利用 模型 中 
用 到 的 指数 分 布 与 正 态 分布 的 独立 性 , Kou (2002) 得 到 了 G 的 概率 密度 函数 为 


? 2 2 
gigs AAt o2 At/(2n") fe w/nqy (= —@a St) e/g (= +o D 


z pAt+oeVAt+Ix X, (6.30) 


2r onv At anv At 
1 A) 
E -—JXA 5.31 
080 75! (is man 


HP w —c— pAt— s, JF B. f() A (0) 分 别 是 标准 正 态 随机 变量 的 概率 密度 函数 
和 累积 分 布 函数 . 另外 ， 


E(G) = pAt +KAAt, Var(G) = o? At + AAt[2r? + &?(1— AAt)]. 
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6-9 显示 了 正 态 分 布 与 方程 (6.31) 的 分 布 的 概率 密度 函数 的 一 些 比较 . 两 个 分 
布 的 均值 都 是 0、 方差 都 是 2.057 2 x 10-4. 均值 和 方差 是 通过 假定 标的 资产 的 年 
收益 率 满足 ps = 2096, o = 2096 , At = 1 天 — 1/252 4E, A = 10, & = —0.02, y = 0.02 
而 得 到 的 . 换 句 话说 , 我 们 假定 每 年 大 约 有 10 天 跳跃 , 平均 跳跃 大 小 为 —2%. 跳跃 
波动 率 为 2%. 这 些 值 对 美国 股票 是 合理 的 . 从 图 中 , 可 以 清楚 地 看 到 由 方程 (6.26) 
的 跳 妈 扩 散 过 程 推导 出 的 分 布 的 尖峰 态 性 质 ， 该 分 布 比 相应 的 正 态 分 布 有 更 高 的 
峰 和 更 厚 的 尾巴 . 


(a) 密度 函数 (c) 左 屁 比较 
4 
3 
te 2 
1 
Ü 
—0.10 —0.05 0.0 0.05 0.10 —(0.10 —0.08 一 0.06 —0.04 
T T 
(b) 尖峰 比较 (d) HREH 
0.4 \ 
x \ 
$& 024 V 
0.0 z z 
—0.010—0.005 0.0 0.005 0.010 0.04 0.05 0.06 007 0.08 0.09 0.10 
z T 


图 6-0. 正 态 分 布 和 方程 (6.31) 分 布 的 密度 比较 . eR Fem IAA. 两 个 分 布 的 均值 都 是 0、 
方差 都 是 2.057 2 x 1074. (a) 整体 比较 ; (b) 尖峰 的 比较 ; (c) 左 尾 ; (d) AR 


跳跃 扩散 下 的 期 权 定 价 


当 随 机 跳跃 出 现时 , 市 场 将 变 成 不 完全 的 . 在 这 种 情况 下 , 标准 套 期 变量 对 期 

权 定 价 就 不 再 适用 了 . 但 我 们 仍 可 以 推导 出 不 依赖 于 对 风险 的 态度 的 期 权 定价 公 

X. 方法 是 假定 可 利用 的 证 券 数量 非常 大 ， 以 至 于 突然 跳跃 的 风险 是 可 以 分 散 的 ， 

并 且 市 场 因 此 对 超过 无 风险 利率 的 部 分 承担 风险 时 将 不 支付 风险 溢价 . 换 句 话说 . 
对 于 风险 溢价 的 一 个 给 定 集合 , 可 以 考虑 风险 中 性 测度 P*, 满足 
= = [r — AE(J — 1)]dt + edu, 1 d Eo = 9 


t l 


= (r —Aw)dt + adu; +d È (J44— »| ; 
í£—1 
其 中 r 是 无 风险 利率 , J = exp(X) 满足 X 服从 方程 (6.27) 的 双 指 数 分 布 , v = 
e*/(1—7?) 1,0 « » <1. 考虑 风险 溢价 时 , 参数 n, n, y Mo 变 成 了 风险 中 性 参 
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数 . 具体 可 参见 Kou (2002). 前 面 方程 的 唯一 解 为 


2 nt 
nee $29) n] 


i=1 
为 了 对 跳跃 扩散 模型 中 的 一 个 欧式 期 权 定价 , 剩 下 的 就 是 计算 期 权 折 现 的 最 终 回报 


在 测度 P* 下 的 期 望 . 具体 来 讲 , 一 个 欧式 看 涨 期 权 在 上 时 刻 的 价格 可 以 由 下 式 给 
出 


c, = E.[e "(Pr — K),] 


=E, | (^ exp (5 TET T) m —2) 4 ovT =t] | II J K) | , (6.32) 


$-31 


其 中 7 是 到 期 日 , (T — 0 是 用 年 测量 的 离 到 期 日 的 时 间 , K 是 执行 价格 , (y) = 
max(0, y), c 是 标准 正 态 随机 变量 . Kou(2002) 证 明了 c, 在 解析 上 是 可 以 处 理 的 , 因 
为 


oc n i + 
xray A(T —t)? 2 2n—j-1 
= pee 8) Pe s 
a= pyrene s P (munt) 


n—1 j—1 n—1 
x (Anu T Aang T A3.n,j) (6.33) 
+e Pe 997 O(n.) — Ke 0 e(R..)], 
其 中 o(.) 是 标准 正 态 随机 变量 的 累积 分 布 函数 ， 
- —Awv(T-—t) - 1 1 coa TUE-) gu 
21.53 = Pre t) z ü-y E jy 十 ü T gy (b) e K®(b_), 


Anj = A s 


" 


1 
4amj = Leon ire ra rt C ge 


cvVT —1N. 1 
"Eb a ke 
In(Fi/ K) + (r to" /2— A(T —t) + n 


b4 = pe T 
h In(P,/K) + (r+ 07/2 — Mw) \F= 8) 
=~ ov T —t 
ovT —t w 
Bie 


7] YT =t" 
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w= In(K/P,) ) - Av(T — t) — (r — o?/2)(T — t) — nk, 
M TY 
Lo 


而 函数 Hh,(-) 定义 为 


Hhi(z)- "n an (s— z)"^e7* /2ds n—40,1,.-, (6.34) 
AA Hh.a(x) = exp(—2?/2), 当 f(z) 是 一 个 正 态 随机 变量 的 累积 分 布 函数 时 , 它 
就 是 V2rf (x). 详 见 Abramowitz 和 Stegun(1972). PRA Hh, (m) 满足 下 面 的 递 推 
A 

nHhy(x) = Hh,-2(z) -zrHhgs i(z), nmz1l, (6.35) 


初始 值 为 Hh a(z) —e-7/2, B. Hho(z) = v2xe(— 

定价 公式 涉及 一 个 无 穷 序 列 , 但 是 Pc i, PUT (truncation) (f| dtl, 
前 10 项 ) 快速 而 精确 地 逼近 . 如 果 和 = 0( 即 没有 跳跃 ) 则 很 容易 看 到 对 于 前 面 讨 
论 的 看 涨 期 权 而 言 , e, 简化 为 B-S 公 

最 后 , 考虑 跳跃 扩散 模型 的 条 件 下 , 一 个 欧式 看 跌 期 权 的 价格 可 以 通过 涨 - 跌 
平价 得 到 , 即 


Pt = Ct + Ke (0-0 — Pe: 


在 方程 (6.26) 的 跳跃 扩散 模型 下 的 其 他 期 权 定 价 公式 可 以 参见 Kou (2002). 

例 6.8 考虑 例 6.6 中 的 股票 ,当前 价格 为 S80. 如 前 , 假定 欧式 期 权 的 敲定 价格 
Àj K = $85, 且 其 他 参数 为 r = 0.08, T — t = 0.25. 另外 , 假设 股价 服从 方程 (6.26) 
中 的 跳跃 扩散 模型 , 参数 为 A= 10, « = —0.02, n = 0.02. MEI, 每 年 大 约 有 
10 个 跳跃 , 平均 跳跃 大 小 为 -2% 且 跳 跃 波动 率 为 2%. 利用 方程 (6.33) 中 的 公式 ， 
我 们 得 到 c, = 3.92, 当 没 有 跳跃 时 高 于 例 6.6 中 的 $3.49. 相应 的 看 跌 期 权 假 定 为 
pe — $3.31, 也 比 我 们 以 前 的 高 很 多 . 正如 所 期 望 的 , 当 保持 其 余 参 数 不 变 , MABE 
跃 时 就 增加 了 两 种 欧式 期 权 的 价格 . 然而 , 请 注意 , 实际 应 用 时 , 在 股价 中 加 入 跳跃 
过 程 经 常 导 致 股票 波动 率 o 的 不 同 估计 . 


6.10 连续 时 间 模 型 的 估计 


下 面 我 们 考虑 直接 从 离散 样本 数据 中 估计 扩散 方程 ( 即 伊 芯 过 程 ) 的 问题 . 这 
里 漂移 函数 ulet) 和 波动 率 函 数 oleet) 都 是 时 变 的 , 并 可 能 不 服从 一 个 具体 的 
参数 形式 . 这 是 近年 来 引起 人 们 很 大 兴趣 的 一 个 主题 . 具体 方法 的 细节 超出 了 本 章 
的 范围 , 因此 我 们 仅 对 文献 中 提出 的 方法 简要 介绍 一 下 , 有 兴趣 的 读者 可 以 查阅 相 
应 的 文献 以 及 Lo (1988). 
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估计 一 个 扩散 方程 时 有 几 种 可 以 利用 的 方法 . 第 一 种 方法 是 拟 最 大 似 然 方法 ， 
它 利用 了 dw, 在 一 个 很 小 的 时 间 间 隔 上 是 正 态 分 布 的 事实 . 参见 Kessler (1997) 及 
其 参考 文献 .第 二 种 方法 是 于 方法 . 参见 Conley, Hansen, Luttmer 和 Scheinkman 
(1907) 及 其 参考 文献 . 第 三 种 方法 是 利用 非 参 数 方法 . 参见 Ait-Sahalia (1996, 
2002). 第 四 种 方法 是 利用 半 参 数 方法 和 再 投影 (reprojection) 方法 . 参见 Gallant 
fI Long (1997), Gallant 和 Tauchen (1997). 最 近 , 许多 研究 者 已 经 开始 利用 MCMC 
方法 来 估计 扩散 方程 . 具体 可 参见 Eraker (2001) 以 及 Elerian, Chib 和 Shephard 
(2001). 


附录 A B-S 公式 积分 


本 附录 将 推导 出 方程 (6.19) 给 出 的 欧式 看 涨 期 权 的 价格 . 令 z = ln(Pr), 利用 
变量 代 换 以 及 g(Pr)dPr = f(z)dz, 其 中 f(x) 为 z 的 概率 密度 函数 , 我 们 有 


a= exp et d] y (Pr — K)g( Pr)dPr 


一 pee | (ez — K) f(x)dx 
In( K) 


=e "(Tt) I c*f(r)dxr — K i Ta ‘ (6.36) 
In( K) In( K) 


HA £= In(Pr) ~ N[In(P;)4- (r —e?/2)(T —t),0?(T — t), MARTE (6.36) 中 第 二 
项 的 积分 简化 为 


oc In( K) 
| fic -1 - [ores 
In( K) 


sgj edf(In(K)) 
—1- é(—-h.) = &(h_), 


其 中 cdf(In(K)) 为 z = In(Pr) 的 累积 分 布 函数 在 In(K) 处 的 取 值 , DO) 是 标准 正 
态 随 机 变量 的 累积 分 布 函数 , 而 且 


_ In(K) — In(Pt) — (r — 9? /2)(F — t) 

j ENT —t 

S In(P,/K) — (r — o?/2)(T — t) 
CV —t : 


—h_ 


方程 (6.36) 中 第 一 项 的 积分 可 以 写 为 


[ 1 a |:- [r — In(P;) mE F3 
in(K) v2r/a?(T —t) — 2c?(T — t) : 
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其 中 指数 可 以 简化 为 
[x — In(P) - (r — 0? /2)(T - t)/? 
EE 2e?(T — t) 
= 32 422 
n 000 ANE OF eeg sp 
因此 , 第 一 个 积分 变 为 
L e f(a)da 
In( K ) 
= Per(T-*) TY 1 _ [z — {In(P,) + (r + 0? /2)(T — 0))?? 
iai; a V2n4/a?(T — t) ed | 202(T — t) | on, 


‘Cae T PME In(P,) + (r+ 0?/2)(T — 1). 2728389 07 (T — t) 的 正 态 分布 的 累 
积分 布 函数 . 利用 前 面 证 明 第 二 个 积分 的 同样 方法 , 我 们 有 


| e? f(z)dz = Pye'(T-9(h, ), 
In( kK) 


其 中 hy 由 下 式 给 出 
n In(P,/ K) «r4 c?/2)(T — t) 
T oyT —t i 
将 两 个 结果 结合 , 我 们 就 有 


ce =e (T9 (Pre? 9 S(hy.) — KO(h_)] = Pj9(h,) 一 Ke-"(7-?o(n. ). 


附录 B 标准 正 态 概 率 的 近似 


一 个 标准 正 态 随机 变量 的 累积 分 布 函 数 cdf 更 (z) 可 以 近似 为 
p(z) = 工 一 f(z)lek 十 Cok? 4 ca k? -f cak* 十 csk?], Xr > 0. 
1 — $(—2), tix <0. 


其 中 f(x) = exp(—x?/2)//2x,k = 1/(1 + 0.231 641 9x), cı = 0.319 381 530, c2 = 

一 0.356 563 782 , c3 = 1.781 477 937, c4 = —1.821 255 978, cs = 1.330 274 429. 
例如 , 利用 前 面 的 近似 , 我 们 得 到 (1.96) = 0.975 002, (0.82) = 0.793 892. 

9(—0.61) = 0.270 931. 这 些 概率 与 个 典型 的 正 态 概率 表 中 得 到 的 值 非常 接近 . 


练 习 a 
6.1 假定 对 数 价格 p, = In( P.) 服从 一 个 随机 微分 方程 


dp, = ydt + a dus, 
其 中 us 是 一 个 维 纳 过 程 . 试 推导 价格 已 的 随机 方程 . 
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6.2 考虑 一 个 不 支付 红利 的 股票 的 远 期 价格 P. 我 们 有 
Dr = p,et-0 
其 中 了 是 无 风险 利率 , 它 是 常数 ; P. 是 当前 的 股价 . 假设 P. 服从 几何 布朗 运动 
dP, = i. Pt 十 G Pidus. 


试 推导 Fer 的 随机 微分 方程 . 
6.3 假定 IBM 股票 的 价格 服从 伊 蕊 过 程 


dP, = pn Pdt + c Pidur, 


其 中 u M o 都 是 固定 的 , w 是 一 个 标准 的 布朗 运动 . 考虑 IBM 股票 在 1997 年 的 日 对 数 
收益 率 . 平均 收益 率 与 样本 的 标准 差分 别 为 0.001 31 和 0.022 15. 假设 1997 年 有 252 个 
交易 日 , 运用 此 数据 来 估计 参数 u 和 c. 

6.4 假设 一 只 股票 的 当前 价格 是 每 股 120 美元 , 年 波动 率 o =50%. 进一步 假定 年 无 风险 利率 
为 7%, 且 该 股票 不 支付 红利 . (a) KARE A $125 且 到 期 时 间 为 3 个 月 的 欧 
式 看 涨 期 权 的 价格 是 多 少 ? (b) 这 只 股票 的 敲定 价格 为 8 118 且 到 期 时 间 为 3 个 月 的 欧式 
看 跌 期 权 的 价格 是 多 少 ? 如 果 年 波动 率 增加 到 SO%, 那么 两 种 期 权 的 价格 分 别 是 多 少 呢 ? 

6.5 推导 一 其 股票 的 网 式 看 跌 期 权 中 5 个 变量 K, PIT —t0 Rr 的 极限 边际 效应 ， 

6.6 股票 当前 的 价格 为 每 股 60 美元 , 并 且 服 从 几何 布朗 运动 


dP, = uPidt + o Pdt. 


假设 该 股票 的 年 期 望 收益 率 为 u, 年 波动 率 为 40%, 问 股价 在 两 年 内 的 概率 分 布 是 什么 ? 
试 求 该 分 布 的 均值 和 标准 差 , 并 且 对 此 股价 构造 一 个 95 锅 的 置信 区 间 ， 
6.7 当前 股价 为 每 股 60 美元 , 并 服从 几何 布朗 运动 


dP, = uPdt + a Fidt. 


假设 该 股票 的 年 期 望 收 益 率 为 u, 年 波动 率 为 4096. 问 股票 两 年 的 连续 复合 收益 率 的 概率 
分 布 是 什么 ? 试 求 此 分 布 的 均值 和 标准 差 . 

6.8 假设 股票 A 的 当前 价格 是 每 股 70 美元 , 此 价格 服从 方程 (6.26) 的 跳跃 扩散 模型 . 假定 
年 无 风险 利率 为 8%, 股票 不 分 红 , 年 波动 率 为 3096. 535b, 价格 平均 每 年 大 约 有 15 个 跳 
EX. 平均 的 跳跃 大 小 为 —2%, 跳跃 波动 率 为 3%. RE TRA $75 且 到 期 时 间 为 3 个 月 
的 一 个 欧式 看 涨 期 权 的 价格 是 多 少 ? 相应 的 欧式 看 跌 期 权 的 价格 是 多 少 ? 

6.9 考虑 没有 分 红 支付 的 股票 的 欧式 看 涨 期 权 . 假定 P, = $20, K = $18, 年 利率 为 了 = 6%, 
T —t=0.5 年 . 如 果 股 票 的 欧式 看 涨 期 权 的 价格 是 82.10, 套利 者 有 套利 的 机 会 吗 ? 

6.10 考虑 没有 分 红 支 付 的 股票 的 欧式 看 中 期权, 假定 P, = $44, K = $47, FRH r= 6%, 

T t=0.5 F. 如 果 股 票 的 欧式 看 跌 期 权 的 价格 是 $1.00, 套利 者 有 套利 的 机 会 吗 ? 
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第 7 章 ” 极 值 理论 、 分 位 数 估 计 与 风险 值 


在 金融 市 场 中 极端 的 价格 运动 虽然 少见 , 但 很 重要 . 1987 年 10 月 华尔街 股市 的 
崩盘 以 及 其 他 大 的 金融 危机 (例如 长 期 资本 管理 , Long Term Capital Management) 
已 经 引起 了 实际 应 用 者 和 研究 者 们 的 广泛 关注 . 一 些 人 甚至 呼吁 政府 加 强 对 衍生 证 
券 市 场 的 监管 . 近年 来 , 高 科技 股 表面 上 很 大 的 日 价格 变动 进一步 产生 了 关于 市 场 
风险 以 及 金融 机 构 保证 金 设 置 的 讨论 . 因此 , 风险 值 (Value at Risk, 简 记 为 VaR) 成 
为 在 风险 管理 中 广泛 使 用 的 市 场 风 险 的 度量 标准 . 

本 章 主要 讨论 计算 VaR 的 各 种 方法 以 及 这 些 方法 后 面 的 统计 理论 . 特别 地 , 我 
们 考虑 在 统计 文献 中 发 展 起 来 的 极 值 理论 来 研究 稀少 (或 异常 ) 事件 及 其 对 VaR 
的 应 用 . 其 中 极 值 理论 的 条 件 概念 与 无 条 件 概念 都 在 讨论 之 列 . 金融 头寸 VaR i 
算 的 无 条 件 方 法 需要 用 到 计算 VaR 所 涉及 的 金融 工具 的 历史 收益 率 . 然而 , 条 件 方 
法 则 运用 历史 数据 与 解释 变量 来 计算 VaR. 

本 章 讨 论 的 其 他 计算 van 的 方法 是 风险 度量 制 (RiskMetrics)、 波动 率 模型 的 
经 济 计 量 模 型 以 及 经 验 分 位 数 . 我 们 利用 BM 股票 的 日 对 数 收 益 率 来 解释 所 有 所 
讨论 方法 的 实际 计算 . 因此 , 得 到 的 结果 可 以 用 来 比较 不 同方 法 的 表现 . 图 7-1 描 
述 了 IBM 股票 从 1962 年 7 月 3 日 至 1998 年 12 月 31 日 的 日 对 数 收益 率 , Jk 
9 190 个 观测 值 的 时 间 图 . 


1 


-n.3 


1970 1980 1991) 2000 
年 
图 7-1 1962 427 H 3 A 1998 年 12 A 31 H IBM 股票 日 对 数 收益 率 的 时 间 图 


7.1 M EK fà 
金融 市 场 中 有 几 种 类 型 的 风险 , 其 中 三 个 主要 类 别 的 金融 风险 是 信用 风险 、 流 
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动 性 风险 以 及 市 场 风险 ，VaR 主要 讨论 市 场 风险 , 但 是 它 也 可 以 应 用 于 其 他 类 型 
的 风险 . VaR 是 在 某 个 风险 范畴 中 的 机 构 的 头寸 在 一 个 给 定 持 有 期 间 内 可 能 会 由 
于 一 般 的 市 场 运动 而 降低 所 带 来 的 损失 的 统一 估计 . 对 VaR 的 一 般 阐述 , 可 参见 
Duffie 和 Pan(1997) 以 及 Jorion (1997). 金融 机 构 可 以 利用 这 一 尺度 来 评估 他 们 的 
风险 , 或 者 通过 一 个 管理 委员 会 设 定 边际 要 求 . 在 其 他 情形 , 可 以 用 VaR 来 确保 金 
融 机 构 经 过 一 个 灾难 性 事件 之 后 仍然 可 以 运转 , 从 金融 机 构 的 角度 , VaR 可 以 定义 
为 金融 头寸 在 一 个 给 定时 间 段 上 , 以 某 个 给 定 的 概率 发 生 的 最 大 损失 . 以 这 种 观点 ， 
可 以 将 VaR 看 作 是 在 正常 市 场 条 件 下 与 稀少 (异常 ) 事件 相 联 系 的 损失 的 一 个 度 
Tf. 换 句 话 说, 从 管理 委员 会 的 角度 , VaR 可 以 定义 为 在 异常 市 场 情 境 下 的 最 小 损 
K. 两 种 定义 尽管 概念 上 貌似 相差 很 远 , 但 都 将 导致 同样 的 VaR BERE. 

下 面 , 我 们 在 概率 框架 下 定义 VaR. 假设 在 时 间 指 标 t 点 , 我 们 感 兴趣 的 是 接 
下 来 的 | 段 中 一 个 金融 头 才 的 风险 . 令 AV) 表示 金融 头寸 中 , 从 时 刻 t 到 时 刻 
i 十 ! 时 资产 价值 的 变化 . 这 个 数量 用 美元 度量 , 且 在 时 间 指 标 为 t 时 是 一 个 随机 变 
量 . 用 Fx) 表示 AV() 的 畦 积分 布 函数 (cdf). 定义 一 个 多 头头 寸 在 持 有 期 ! 中 
概率 为 p 的 VaR 为 

p = Pr[AV (I) < VaR] = F;(VaR). (7.1) 
因为 当 AV(l) < 0 时 , 一 个 多 头 金融 头寸 的 持 有 者 遭受 损失 , 所 以 当 p 很 小 时 , 方 
程 (7.1) 中 定义 的 VaR 是 一 个 负 值 , 其 中 负 号 表示 一 个 损失 . 由 定义 , 在 时 间 区 间 1 
E, 持 有 者 将 要 遭受 的 损失 大 于 或 等 于 VaR 的 概率 p. 换 一 种 说 法 , VaR 可 以 解释 
如 下 : 以 概率 1 一 p, 金融 头寸 的 持 有 者 在 时 间 区 间 ! 上 遭受 的 潜在 损失 小 于 或 等 
T VaR. 

当 资 产 价值 增加 [ 即 AV (1) > 0] 时 , 空头 头寸 的 持 有 者 遭受 损失 , 这 时 VaR 定 
义 为 

p = Pr[AV(I) > VaR] = 1 — Pr[AV (l) < VaR] = 1 — F;(VaR). 
对 于 一 个 小 p, 空头 头 才 的 VaR 为 一 个 正 值 , 其 中 正 号 表示 一 个 损失 . 

前 面 的 定义 显示 VaR 关注 的 是 累积 分 布 函数 Flr) 的 尾部 行为 . 对 一 个 多 头 
头寸 , Fi(z) 的 左 尾 很 重要 , 然而 对 室 头 头寸 则 主要 关注 于 h(x) 的 右 尾 . 注意 到 如 
果 利 用 —AV (0) 的 分 布 , 则 方程 (7.1) 中 VaR 的 定义 也 可 以 应 用 十 空头 头寸 . 因此 ， 
仅 利 用 多 头头 寸 米 讨论 VaR 计算 的 方法 就 足够 f. 

对 任何 一 元 的 崇 积 分 布 函数 Fy (ax) 与 概率 p(0 < p< 1), KH 

Tp = inf(z|Fi(z) > p] 
为 F(x) 的 p— 分 位 数 , 其 中 inf 表示 满足 Fir) > p 的 最 小 实数 .如 果 已 知 方程 
(7.1) 中 的 累积 分 布 函数 Filz), 则 VaR 就 是 它 的 p- 分 位 数 ( 即 VaR = zp). 然而 


实际 中 cdf 是 未 知 的 , 从 而 对 VaR 的 研究 主要 关心 的 是 cdf 及 其 分 位 数 的 估计 , 万 
其 是 cdf 的 尾部 性 质 . 
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在 实际 应 用 中 , VaR 的 计算 涉及 如 下 几 个 因素 . 

(1) 感 兴趣 的 概率 p, 例如 p= 0.01 E p = 0.05. 

(2) 时 间 区 间 1. 它 可 由 管理 委员 会 设 定 , 例如 1 天 或 10 天 . 

(3) 数据 频率 . 它 可 能 与 时 间 区 间 1 不 一 样 且 经 常 使 用 日 观测 值 . 

(4) 累积 分 布 函数 F(x) 或 它 的 分 位 数 . 

(5) 金融 头寸 的 数量 或 者 证 券 组 合 的 有 盯 市 价值 (market-to-market value). 
在 这 些 因 素 中 , 累积 分 布 函数 A (ec) 是 经 济 计量 模型 的 焦点 ,累积 分 布 函数 估计 的 
不 同方 法 引起 了 VaR 计算 的 不 同方 法 . 

注释 1: ”方程 (7.1) 中 的 VaR 定义 是 用 美元 度量 的 . 因为 对 数 收 益 率 近似 等 
于 金融 头寸 价值 的 百分比 变化 , 所 以 在 数据 分 析 中 我 们 使 用 的 是 对 数 收益 率 r. 给 
定时 刻 已 知 信息 的 条 件 下 , Bri 分 布 的 分 位 数 计 算 的 VaR 用 百分比 表示 , A 
此 VaR 的 美元 计量 为 金融 头寸 的 现金 值 乘 以 对 数 收 益 率 序列 的 VaR. 即 VaR = 3L 
金 值 x 对 数 收 益 率 的 VaR. 必要 的 时 候 , 可 以 使 用 近似 VaR = 现金 值 x[exp( 对 数 
收益 率 的 VaR)—1]. " 

注释 2: VaR 关注 的 是 组 合 在 给 定时 间 区 间 上 的 可 能 损失 的 一 个 预测 . 可 以 
利用 金融 头寸 未 来 收益 率 的 预测 分 布 来 计算 . 例如 , 使 用 日 收益 率 r 且 组 合 在 1 天 
持 有 期 的 VaR 可 以 利用 ría AAE t 时 刻 已 知 信息 下 的 预测 分 布 来 计算 . 由 统计 
的 观点 , 在 一 个 恰当 指定 的 模型 中 , 预测 分 布 考虑 了 参数 的 不 确定 性 . 然而 , 预测 分 
布 很 难得 到 , 并 且 大 多 数 VaR 计算 可 以 利用 的 方法 都 忽视 了 参数 不 确定 性 的 影响 ， 

口 


7.2 ”风险 度量 制 


J.P. Morgan 将 风险 度量 制 方法 发 展 到 了 VaR 计算 中 . 详 见 Longerstaey 和 
More (1995). 风险 度量 制 的 简单 形式 假定 组 合 的 连续 复合 日 收益 率 服从 一 个 条 件 
正 态 分 布 . 用 r 表示 日 对 数 收益 率 , Fii 表示 t 一 1 时 刻 可 以 得 到 的 信息 集合 . 风 
险 度量 制 假定 w|i ~ N (pir, 07), 其 中 pe J re 的 条 件 均 值 , zz 是 x 的 条 件 方差 . 
另外 , 这 个 方法 假定 这 两 个 量 是 随时 间 变 化 的 , 对 应 于 简单 的 模型 : 


m=0, of =007_,4+(1-—a)r?_,, 0«a«1. (7.2) 


因此 , 此 方法 假定 组 合 的 日 价格 的 对 数 p, = InP.) 满足 差分 方程 pi 一 pt_1 = a4, 其 
中 a, = ore, 是 一 个 无 漂移 的 IGARCH(1,1) 过 程 . a 的 值 通常 取 在 区 间 (0.9, 1) E, 
其 中 一 个 代表 值 为 0.94. 

这 样 一 个 特殊 的 随机 游 动 IGARCH 模型 的 良好 性 质 是 : 利用 它 很 容易 得 到 一 
个 多 期 收益 率 的 条 件 分 布 . 具体 来 讲 , 对 k 个 周期 的 持 有 期 , 从 时 刻 t 十 1 到 时 刻 
EARS ttk 时 刻 ) 的 对 数 收益 率 为 二] = rea te Teka tripe. FFAS [k] 
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表示 k 期 收益 率 . 在 方程 (7.2) 中 具体 的 IGARCH(1,1) 模型 下 , 条 件 分 布 [AIF 
是 均值 为 0、 757 2529 o7[k] KES, 其 中 o?[k] 可 以 利用 第 3 章 讨 论 的 预测 方 
法 计算 . 由 的 独立 性 假定 和 模型 (7.2), 我 们 有 


大 
a, |k] = Var(ri[k]| Fc) = $ Var(arsilF), 


$—1 
其 中 Var(ai;|F1) = E(o2,,|F:) 可 以 递 推 得 到 . 利用 ria = aia = Oie 我 们 
可 以 将 方程 (7.2) 中 IGARCH(1,1) 模型 的 波动 率 方 程 改写 为 


of =o2 + (1—a)o? 1(e? -1)， 对 所 有 的 二 


特别 地 , 我 们 有 
dtp = Oia + (1 — ot. (eR 1 一 1 和 二 27 天。 
ALA xt i > 2. Ele? i 一 并 已 ) = 0, 所 以 前 面 的 方程 说 明 


E(o7, ,|F1) 一 El(of,;_1lF), i= 2, Et Jk. (7.3) 


对 向 前 1 步 的 波动 率 预测 ， 由 方程 (7.2) 知 o2,, = aed + (1 a)r?. Bk, Jy 
FE (7.3) WEA T» i > 1, Var(ri4|F)) = o2,,, 从 而 o?[k] = kao?,1， 结 果 说 明 
ri[k]|F. ~ N(0,ko2,,), 因此 , 在 方程 (7.2) 的 这 个 特殊 的 IGARCH(1,1) 模型 下 ， 
re[k] 的 条 件 方差 与 时 间 段 天 成 比例 .大 持 有 期 对 数 收 益 率 的 条 件 标 准 差 为 Vos. 

假定 金融 头寸 是 一 个 多 头头 寸 , 以 致 当 有 一 个 大 的 价格 下 降 ( 即 一 个 大 的 负 收 
ME) 时 损失 发 生 . 如 果 设 定 概 率 为 5%, 则 风险 度量 制 是 用 1.65cl,1 米 度量 证 券 
组 合 风 险 , 即 它 利 用 均值 为 0, 标准 差 为 o 的 正 态 分 布 的 单 侧 5% 分 位 数 . 真实 
的 5% 分 位 数 是 —1.650,,4, 但 是 忽略 了 负 号 , 并 理解 为 它 代 表 一 个 损失 , 因此 , 如 果 
标准 差 是 用 百分比 度量 的 , 则 风险 度量 制 下 证 券 组 合 的 日 VaR 为 


VaR = 头寸 数量 x 1.650444, 
k 天 持 有 期 的 Van 为 
VaR(k) = 头寸 数量 x 1.65V kon, 
其 中 VaR 的 变量 (k) 用 来 表示 时 间 段 . 因此 , 在 风险 度量 制 下 , 我 们 有 
VaR(k) = Vk x VaR, 


并 称 之 为 风险 度量 制 下 Van 计算 的 时 间 平 方 根 法 则 . 

例 7.1 1997 年 德国 马克 /美元 的 汇率 的 连续 复合 日 收益 率 的 样本 标准 差 大 约 是 
0.53%. 假定 一 个 投资 者 长 期 持 有 价值 1 千 万 美元 的 马克 /美元 汇率 合约 , 则 该 投资 
者 1 天 持 有 期 的 5%VaR 是 
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10 000 000 x (1.65 x 0.005 3) 美元 = 87 450 美元 . 
相应 的 1 个 月 持 有 期 (30 天 ) 的 VaR 
10 000 000 x (V30 x 1.65 x 0.005 3) 美元 = 478 983 美元 . 


例 7.2 考虑 图 7-1 中 IBM 的 日 对 数 收益 率 . 正如 第 1 章 中 提 到 的 , 收益 率 的 样 
本 均值 显著 地 不 同 于 0. 然而 , 为 了 说 明 利用 风险 度量 制 的 VaR 计算 , 我 们 假定 这 
个 样本 的 条 件 均值 为 0, 而 且 收益 率 的 波动 率 服 从 一 个 无 漂移 的 IGARCH(1,1) 模 
型 . 拟 合 的 模型 为 


Ti = ats a,— er 02 — 0.939 602 ,十 (1 一 0.939 6)a?_,, (7.4) 


其 中 (e) 是 标准 的 高 斯 白 只 声 序列 . 如 所 料想 的 , 由 Q 统计 量 , 拒绝 了 这 个 模型 . 
例如 , 对 于 标准 残 差 的 平方 , 我 们 有 一 个 高 度 显 著 的 统计 量 Q(10) = 56.19. 

由 数据 与 拟 合 的 模型 , 我 们 有 rgi90 = —0.012 8, 62,94 = 0.000 347 2. 因此 ,一 
步 向 前 波动 率 预 测 为 如 oo(1) = 0.000 336. 条 件 分 布 roiroi Foiro 的 5 名 分 位 数 为 
—1.65 x V0.000 336 = —0.030 25, 这 里 将 负 号 理解 为 表示 损失 . 因此 , 1 千 万 美元 的 
多 头头 寸 在 1 天 持 有 期 内 的 5%VaR 为 


VaR = 10 000 000 x 0.030 25 美元 = 302 500 美元 . 


1% 分 位 数 是 —2.326 2 x V0.000 336 = —0.042 65, 相应 的 相同 多 头头 寸 的 1% VaR 
为 426 500 美元 . 

注释 : ”为 了 应 用 S-Plus 中 的 风险 度量 制 , 我 们 可 以 用 mgarch (多 元 GARCH) 
命令 下 的 ewmal (一 阶 指数 加 权 滑 动 平 均 ) 来 估计 1 一 Q. 然后 用 命令 predict 获 
得 波动 率 预 测 . 对 于 所 用 的 IBM 数据 , a 的 估计 是 1 — 0.036 = 0.964, 波动 率 的 向 
前 一 步 预 测 是 S0190(1) = 0.018 88. 具体 参见 下 面 的 演示 . 可 算得 对 于 pp 二 0.05 和 
p—0.01, 分 别 有 VaR — 311 520 美元 和 VaR = 439 187 HA. 这 两 个 VaR 值 要 比 
例 7.2 给 出 的 值 稍 小 . 例 7.2 是 基于 RATS 程序 给 出 的 估计 . o 
S-Plus 演示 
输出 结果 已 经 简化 . 

>ibm.risk=mgarch(ibm~-1, ~ewmal) 

>ibm.risk 

ALPHA 0.036 

>predict (ibm.risk, 2) 

$sigma.pred 0.01888 


7.2.1 讨论 


风险 度量 制 的 一 个 优点 就 是 简单 , 很 易于 理解 和 运用 . 另外 一 个 优点 是 它 使 得 
金融 市 场 中 的 风险 更 加 透明 了 . 然而 , 因为 证 券 收 益 率 常常 有 厚 尾 (或 肥 尾 ), 所 以 
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正 态 性 假定 通常 导致 VaR 的 低估 . 其 他 计算 VaR 的 方法 也 要 避免 作 这 样 一 个 假 
5E. 

时 间 平 方 根 法 则 是 风险 度量 制 中 运用 特殊 模型 的 一 个 结果 . 如 果 对 数 收益 率 的 
零 均 值 假定 或 者 具 休 的 IGARCH(1,1) 模型 假设 不 满足 , 则 此 准则 就 失效 了 . 考虑 
下 面 这 个 简单 模型 ; 


2 2 2 
Ti = Uth oo= 0 pF, of = az, +(1—a)azy,, 


其 中 {e} 是 标准 的 高 斯 白 噪 声 序 列 . p AO 的 假定 对 许多 在 NYSE 中 大 量 交 易 的 
股票 收益 率 都 是 成 立 的 ( 见 第 1 章 ). 对 于 上 面 这 一 简单 模型 , 给 定 FL 下 rea 的 
分 布 服 从 N(u.o2,,). 用 来 计算 1 天 持 有 期 VaR 的 5% 分 位 数 变 为 j — 1.659143. 
对 一 个 大 RAH, Ase F, F i(k] 的 分 布 服从 N(kp,ko?,1), 其 中 同 前 面 一 样 ， 
Telk] = feg tees + Teker t+ Preek K 天 持 有 期 Van 计算 中 运用 的 5% 分 位 数 是 
kp — 1.65V/koq441 = VE(Vkk — 1.650741). 因此 , 当 平 均 收益 率 不 为 0 时 , VaR(K) z 
VE x VaR. 同样 很 容易 证 明 当 收益 率 的 波动 率 模型 不 是 无 漂移 的 IGARCH(1,1) 模 
型 时 , 此 方法 也 是 失效 的 . 
7.0.0 ”多 个 头寸 

在 一 些 应 用 中 , 投资 者 可 能 持 有 多 个 头寸 , 并 且 需 要 计算 头寸 的 全 部 Van. 做 
这 样 一 个 计算 时 , 在 假定 每 个 头寸 的 日 对 数 收益 服从 一 个 随机 游 动 IGARCH(1,1) 
模型 下 , 风险 度量 制 采 取 了 一 个 简单 方法 . 需要 的 额外 量 是 收益 率 间 的 交叉 相关 系 
数 . 考虑 两 个 头寸 的 情况 . 令 VaR, 和 VaR. 表示 两 个 头寸 的 VaR, IFAS p X 
示 两 个 收益 率 间 的 交叉 相关 系数 , 即 pre = Cov(rat,rat)/[Var(ri)var(ratj] ^. 则 投 
资 者 的 全 部 VaR 为 


VaR = VVaR2 + VaR? + 2515 VaR; VaRa. 


一 个 包含 m 个 工具 的 头寸 的 VaR 一般 式 可 由 下 式 得 到 ; 


m m 
VaR = >》 VaR? + 25  pij VaR; VaR;, 
t=1 i<j 


其 中 5; 是 第 i 个 与 第 j 个 工具 的 收益 率 间 的 交叉 相关 系数 ，VaR; 表示 第 i 个 工 
具 的 VaR. 


7.3 VaR 计算 的 计量 经 济 方法 


VaR 计算 的 一 个 一 般 方法 就 是 利用 第 2 章 到 第 4 章 中 时 间 序 列 的 经 济 计量 模 
型 . 对 于 一 个 长 期 收益 率 序列 , 可 以 利用 第 2 章 中 的 时 间 序 列 模型 来 对 均值 方程 建 
模 , 并 且 可 利用 第 3 章 或 第 4 章 的 条 件 异 方差 模型 来 处 理 波动 率 . 为 了 简便 , 我 们 


256 第 7 章 极 值 理 论 、 分 位 数 估计 与 风险 值 


在 讨论 中 利用 GARCH 模型 , 并 将 此 方法 称 为 VaR 计算 的 计量 经 济 方法 ， 也 可 以 
利用 其 他 的 波动 率 模型 (包括 第 4 章 中 的 非 线性 模型 ). 
考虑 某 资产 的 对 数 收益 率 re. 它 的 一 般 时 间 序 列 模型 可 以 写 为 


p q 
T, = $9 bD PiTt=# + Qt 一 » 0ja4 .j, (7.5) 
i=] j=i 
Q4 = OLEt, 
c2 — ao + Mo, * » fat. (7.6) 
i=1 j=1 


方程 (7.5) 到 (7.6) 是 re 的 均值 和 波动 率 方程 . 假定 参数 已 知 时, 可 以 利用 这 两 个 
方程 来 得 到 re 的 条 件 均值 与 条 件 方差 的 1 步 向 前 预测 . 具体 地 , 我 们 有 


p q 
Fall) — ġo + >》 birt 一 X Ojat- 


67 (1) — ao +Y aia] t 启 otj1 
如 果 进 一 步 假定 e, 是 高 斯 的 , 则 给 定 t 时刻 可 得 信息 的 条 件 下 , rea 的 条 件 分 布 服 
从 N[&(1), 62(1)). 用 VaR 计算 的 这 个 条 件 分 布 的 分 位 数 可 以 很 容易 得 到 ， 例如， 
其 5% 分 位 数 是 六 (1) 一 1.656;(1). 如 果 假 定 e; 是 自由 度 为 v 的 标准 化 的 学 生 t- 分 
布 , 则 分 位 数 为 部 (1) — 6(p)o0). 其 中 (p) dz E EE v 的 标准 化 学 生 上 分 
布 的 p— 分 位 数 . 

FH HEUS v 的 学 生 t- 分布 (用 te 表示 ) 的 分 位 数 与 它 的 标准 化 分 布 (用 ts 表 
AR) 的 分 位 数 之 间 有 如 下 关系 : 


ty " q a m q 
p= Pr (ty € q) = Pr (a a) -人 (ss -| r 
其 中 > 2. 也 就 是 说 , 如 果 q 是 自由 度 为 v 的 学 生 t- 分 布 的 p— 分 位 数 , 则 
q/ v/v/(v — 2) WEA iH EDS v 的 标准 化 学 生 t- 分 布 的 p— 分 位 数 . 因此 , 如 果 方 
FE (7.6) 的 GARCH 模型 中 的 e, 服从 自由 度 为 v 的 标准 化 学 生 t- 分 布 且 概率 为 p， 
则 在 时 刻 t 时 , 用 来 计算 1 天 持 有 期 VaR 的 分 位 数 为 
tu(p)oe(1) 
其 中 t,(p) 是 自由 度 为 v 的 学 生 t- 分 布 的 p— 分 位 数 , 这 里 假定 p 的 绝对 值 很 小 ， 
E. p 为 负 值 . 
例 7.3 再 次 考虑 例 7.2 中 IBM 的 日 对 数 收益 率 . 我 们 利用 两 个 波动 率 模型 来 计 
算 一 个 长 期 头寸 1 千 万 美元 在 上 = 9 190 时 1 天 持 有 期 的 VaR. 根据 第 2 章 与 第 3 
章 中 的 建 模 方 法 , 这 些 计量 经 济 模型 是 合理 的 . 


T.(1) + 
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情形 1 
假定 e, 是 标准 正 态 的 , 则 拟 合 的 模型 为 
re = U.000 66 — 0.024 Tri-2 + üt; ae = et, 
a? = 0.000 003 89 + 0.079 9a2_1 + 0.907 30?. 
由 数据 , 我 们 有 ro iso = —0.002 01, ro190 = —0.012 8, 02499 = 0.000 334 55. 因此 ， 
前 面 的 AR(2)-GARCH(1,1) 模型 产生 的 1 步 向 前 预测 为 
fa190(1) = 0.000 71, ĉžioo(1) = 0.000 321 1. 


5% 分 位 数 为 
0.000 71 — 1.649 9 x V0.000 321 1 = —0.028 77, 


这 里 负 号 理解 为 表示 条 件 正 态 分 布 的 左 尾 . 长 期 头寸 1 亿美 元 概率 为 0.05 的 VaR 
为 VaR = 10 000 000 x 0.0287 7 美元 = 287 700 美元 .结果 表明 , 假定 AR(2)- 
GARCH(1,1) 模型 成 立 , 则 以 概率 95%, 下 一 天 持 有 此 头寸 的 潜在 损失 是 287 200 
美元 或 低 于 这 个 值 . 如 果 概 率 为 0.01, 那么 1% 分 位 数 为 


0.000 71 — 2.326 2 x V0.000 321 1 = —0.040 973 8. 
头寸 的 VaR 4879 409 738 美元 . 
情形 2 
假定 e, 是 自由 度 为 5 的 标准 化 学 生 t- 分 布 , 拟 合 的 模型 为 
rı = 0.000 3 — 0.033 5re-2 十 at at= oréer, 
v; = 0.000 003 + 0.055 9a2 | 十 0.935 0c? ,. 


由 数据 , 我 们 有 ro iso = —0.002 01, rg190 = —0.012 8, 0249) = 0.000 349. 因此 , 前 面 
的 学 生 -tAR(2)-GARCH(1,1) 模型 产生 的 1 步 向 前 预测 为 


fg190(1) = 0.000 367, 8190(1) = 0.000 338 6. 


自由 度 为 5 的 学 生 t- 分 布 的 5% 分 位 数 为 —2.015, 它 的 标准 化 分 布 的 5% 分 
位 数 为 —2.015/y5/3 = 一 1.560 8. 因此 , 给 定 Foig 条 件 下 , roig 的 条 件 分 布 的 
5% 分 位 数 为 
0.000 367 — 1.560 8V0.000 338 6 = —0.028 354. 


一 个 1 千 万 美元 的 长 期 头寸 的 VaR 为 


VaR = 10 000 000 x 0.028 352 美元 = 283 520 美元 . 
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这 基本 上 与 止 态 性 假定 下 得 到 的 结果 相同 . 条 件 分 布 的 1% 分 位 数 为 
0.000 367 — (3.364 9/ V5/3)V0.000 338 6 = —0.047 594 3. 


对 应 的 VaR 为 475 943 美元 , 与 情形 1 的 结果 比较 , 我 们 可 以 看 出 利用 自由 度 为 5 
的 学 生 t- 分 布 时 的 厚 尾 效应 , 当 尾 概率 变 小 时 增加 了 VaR. 在 S-Plus 中 , 自由 度 为 
m 的 学 生 t- 分 布 的 分 位 数 可 以 由 命令 xp=qt (p,m) 得 到 , 例如 , xp=qt (0.01,5.23). 
多 个 周期 

假定 在 h 时 刻 , 我 们 希望 计算 对 数 收益 率 为 re 的 资产 的 大 期 VaR. 感 兴趣 的 
变量 是 预测 点 h 处 的 大 期 对 数 收 益 率 (BI rafk) = rn 十 … 十 rn 如 果 收 益 率 
re 服从 方程 (7.5) 和 (7.6) 中 的 时 间 序 列 模型 , 则 可 以 通过 第 2 章 和 第 3 章 中 讨论 
的 预测 方法 来 得 到 n, [Kk] 在 给 定 信 息 集 Fh 下 的 条 件 均值 与 条 件 方差 . 


l. 期 望 收益 率 与 预测 误差 


可 以 利用 第 2 章 中 ARMA REAUT ERRER Elrak] Fn). 具体 
来 讲 , 我 们 有 
falk] 二 Th(1) 二 :十 Th(K), 


其 中 r,() 是 收益 率 在 预测 原点 h 时 的 1 步 向 前 预测 . 这 些 预测 可 以 利用 2.6.4 节 
讨论 的 递 推 方法 来 计算 . 利用 方程 (7.5) 中 ARMA 模型 的 MA 表示 
T, = p d- a4 + piati + Pratz t, 
我 们 可 以 将 预测 原点 疡 处 的 1 步 向 前 预测 误差 定义 为 
ea(l) = rage — rn(I) = ange + Wa + +++ + Yani. 


可 参见 方程 (2.33) 以 及 相应 的 预测 误差 . K 期 期 望 收益 率 的 预测 误差 闪闪 是 r 
在 预测 原点 h 处 的 1 步 到 大 步 向 前 预测 误差 的 和 , 可 以 写 为 


en|k] — en (1) 十 eh(2) +--+ + en(k) 
k-1 
=a@n41 + (@n42 + Vian4i) T 3 ian n—i 


i= 


k-1 
— pk + (1+ Yr )anzk—1 +-+ (Y u) Oh+1, (7.7) 
i=1 


其 中 to = 1. 
2. 期 望 波动 率 


期 收益 率 在 预测 原点 h 处 的 波动 率 预 测 是 在 给 定 Fh F en[k] 的 条 件 方差 . 
利用 对 主 == 1,… k crpi 的 独立 性 假定 且 ai; = 0686 RATA 
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mt XA 
Va (en [k]) = Va (an44) + (1+ V1)? Va (ank—1) +-+ (X n) Va (@n+1) 
i=1 


k-i 2 
=o7(k) + (1+ yr)?o%(k— 1) 4- (Eu) es (1), (7.8) 
i=1 


其 中 Vi(z) 表示 给 定 Fh 条 件 下 z 的 条 件 方差 , o2(1) 是 预测 原点 处 的 1— 步 向 前 
波动 率 预 测 . 如 果 波 动 率 模型 是 方程 (7.6) 中 的 GARCH 模型 , 那么 这 些 波动 率 预 
测 可 以 由 第 3 章 讨论 的 方法 递 推 得 到 . 

作为 说 明 , 考虑 特殊 的 时 间 序 列 模型 


Tt = La, Ge = 04£(, 


c? = ay + aa? 十 riks 
则 对 所 有 的 i > 0, 有 vy = 0. 上 期 收益 率 在 预测 原点 h ADA ATRUF, [4] = ky, 
对 应 的 预测 误差 为 
ehlk] = an 十 Qi 1 十 … + anya. 
因此 ,期 收益 率 在 预测 原点 h 处 的 波动 率 预测 为 
k 
Var(ex[k]| Fh) — V ^ oz (). 


利用 3.5 节 中 GARCH(1,1) — atia 
c» (1) = ao + aa} + Biog, 
oill) =ao+ (a1 + /3)o2(1L—1), 1=2,...,k. (7.9) 
利用 方程 (7.9), 对 于 v; = 0 的 情况 下 , 我 们 有 当 ;i > 0 时 ， 


大 大 
Var(ex{k]|F.) = T 上 =- bag | +I 5AN. (7.10) 
HH y= arth <1. MRRP i> 0 有 v; z 0, 则 可 以 利用 (7.8) 式 中 
Var(en[k] Fn) 的 一 般 递 推 公式 . 如 果 是 高 斯 的 , 则 ralk) 在 给 定 Fu 下 的 条 件 分 
布 是 均值 为 ku, 方差 为 Var(en[k]| F5) 的 正 态 分 布 . VaR 计算 中 需要 的 分 位 数 很 容 
易 得 到 . 如 果 a, 的 条 件 分 布 是 非 高 斯 的 (比如 是 学 生 t- 分 布 或 广义 误差 分 布 ), 可 
以 用 模拟 的 方式 得 到 多 期 的 VaR. 

例 7.3( 续 ) XF IBM 股票 的 日 对 数 收益 率 , 考虑 例 7.3 中 的 高 斯 AR(2)-GARCH 
(1,1) 模型 . 假定 我 们 感 兴趣 的 是 在 预测 原点 9 190( 即 1998 年 12 月 30 日 ) 开始 


的 15 ARAB VaR. 我们 可 以 通过 给 定 Foig F, rg190[15] = > T9190+i, 并 
i=] 
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利用 拟 合 的 模型 来 计算 15 天 对 数 收益 率 的 条 件 均值 和 方差 由 方程 (7.9) 递 推 得 
到 条 件 均值 为 0.009 98, 条 件 方差 为 0.004 794 8， 那 么 条 件 分 布 的 5% 分 位 数 为 
0.009 98 — 1.644 94/0.004 794 8 = —0.103 919 1. 因此 , 一 个 1 千 万 美元 的 多 头头 十 
的 15 天 持 有 期 的 VaR 为 VaR = 10 000 000 x 0.103 919 1 美元 = 1 039 191 美元 . 
这 个 数值 低 于 287 700 x V15 美元 = 1 114 257 美元 . 由 这 个 例子 进一步 表明 , 风险 
度量 制 使 用 的 平方 根 时 间 序 列 法 则 仅仅 对 运用 特殊 的 白 噪声 IGARCH(1,1) 模型 成 
立 . 当 条 件 均值 不 为 0 时 , 必须 采取 恰当 的 步骤 计算 k 持 有 期 的 VaR. 


7.4 ”分 位 数 估计 


分 位 数 估 计 提 供 了 VaR 计算 的 非 参 数 方法 . 除了 假定 该 分 布 在 预测 阶段 仍然 
成 立 以 外 , 它 不 对 组 合 的 收益 率 作 具体 的 分 布 假定 . 日 前 有 两 种 类 型 的 分 位 数 方 法 : 
第 一 种 方法 是 直接 利用 经 验 分 位 数 ; 第 一 种 方法 是 运用 分 位 数 回归 . 


7.4.1 ”分 位 数 与 次 序 统计 量 


假定 收益 率 的 分 布 在 预测 期 间 与 样本 期 间 是 一 样 的 . 可 以 利用 收益 率 m 的 经 
验 分 位 数 来 计算 VaR. 令 ns ,rn 表示 样本 期 间 内 组 合 的 收益 率 . 样本 的 次 序 统 
计量 是 这 些 值 用 递增 次 序 排列 后 的 值 . 我 们 利用 记号 


Tay & T(2) S *** S Tin) 


表示 这 个 排列 , 并 将 rt 称 为 样本 的 第 站 个 次 序 统计 量 . 特别 地 , ro 表示 样本 极 小 
fé, T (n) 表示 样本 极 大 值 . 

假定 收益 率 是 独立 同 分 布 并 有 一 个 连续 分 布 的 随机 变量 , 其 分 布 密度 函数 (pdf) 
为 f(x), cdf 为 F(x). 那么 由 统计 文献 (例如 Cox 和 Hinkley, 1994, 见 附录 2), 对 次 
序 统计 量 ru): 其 中 l — np; V<p <1, 我 们 有 下 面 的 渐 近 结果 . 
GR È xy 表示 F(z) 的 p 分 位 数 [| 即 zp = FO! (p). 假定 分 布 密度 函数 f(z) 
在 wy 处 不 等 于 0[ 即 flap) A 0], WAS ry) 是 渐 近 正 态 的 , 且 均值 为 sps 
方差 为 p(1 — p)/(nf?(ap)|. 也 就 是 说 


E 
ray ~ N [zs Es Q tnp: (7.11) 


根据 前 面 的 结果 , 可 以 利用 rw) 来 估计 分 位 数 cp, 这 里 ! = np. 实际 中 , 感 兴 
趣 的 概率 p 可 能 并 不 满足 np 是 一 个 正 整 数 . 在 这 种 情况 下 , 可 以 利用 简单 的 插值 
来 得 到 分 位 数 估计 . 更 具体 地 , 对 非 整 数 np, > h 和 lo 表示 与 np 最 邻近 的 两 个 正 
整数 , 满足 h < np < lo. 并 定义 pi = l;/n. 前 面 的 结果 证 明了 rag 是 分 位 数 nv; 的 
一 个 相合 估计 . HENX, p < p< pa. 因此 ， 分 位 数 可 以 通过 下 式 估 计 : 

PtP P— Pi 
"Oà-m".-y 


T ()* (7.12) 
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Gl 7.4 考虑 英特尔 股票 从 1972 年 12 月 15 HÆ 1997 4 12 月 31 日 的 日 对 数 收 
ii, 共有 6 329 个 观测 值 . 可 以 得 到 数据 5 名 的 经 验 分 位 数 为 


0.05 = 0.557(316) dT 0.45r(317) = —4,229%, 


这 里 np = 6 329 x 0.05 = 316.45, H r 表示 样本 的 第 i 个 次 序 统计 量 . 在 这 个 特 
例 中， T(316) = —4.237%, T(317) = —4.220%. 这 里 我 们 利用 了 经 验 分 布 的 左 尾 (lower 
tail), 因为 它 在 VaR 的 计算 中 与 持 有 一 个 多 头头 十 有关. 

例 7.5 再 考虑 1BM 股票 从 1962 年 7 月 3 日 至 1998 年 12 月 31 日 的 日 对 数 收 益 
A. 利用 全 部 的 9 190 个 观测 值 , 可 以 得 到 5% 的 经 验 分 位 数 为 (raso) + rtaeo))/2 = 
—0.021 603, 其 中 ri; 为 第 i 个 次 序 统计 量 , 而 且 np = 9 190 x 0.05 = 459.5. 1 Tj 
美元 的 多 头头 寸 的 VaR 为 216 030 美元 . 这 远 远 小 于 前 面 用 计量 方法 得 到 的 结果 . 
因为 样本 大 小 为 9 190, RATA 91 < 9 190 x 0.01 < 92, 令 pı = 91/9 190 = 0.009 9, 
pz = 92/9 190 = 0.010 01, 则 得 到 1% 的 经 验 分 位 数 为 


— 0.01 0.01 一 
(91) + 


T = T 
0.01 Po — Pi (91) pı (92) 
0.000 01 0.000 1 | 
T —3.65 
0.000 11^ 9:998) + 9 900 11 3997) 
2: —3.657 


这 个 多 头头 寸 的 1968 1 天 持 有 期 的 VaR Jy 365 709 美元 . 此 值 又 一 次 低 于 了 前 
面 其 他 方法 得 到 的 结果 . 

Wie AHER VaR 计算 的 分 位 数 方法 有 几 个 优势 , 包括 (a) 简单 性 ; (b) 没有 
其 体 的 分 布 假定 . 然而 , 这 个 方法 也 有 几 个 缺点 . 第 一 , 它 假定 收益 率 x, 的 分 布 从 
样本 期 间 到 预测 期 间 是 保持 不 变 的 . 并 假设 VaR 主要 关心 的 是 尾 概 率 , 则 这 个 假 
设 蕴 含 了 预测 的 损失 不 能 高 于 历史 的 损失 , 然而 实际 中 并 不 是 这 样 的 . 第 二 , 对 极 
端 分 位 数 ( 即 当 p 接近 于 0 或 1 时 ), 经 验 分 位 数 并 非 是 理论 分 位 数 的 有 效 估计 . 第 
=, 直接 的 分 位 数 估计 无 法 考虑 与 所 研究 的 组 合 相关 的 解释 变量 的 影响 . 在 实际 应 
HP, 由 经 验 分 位 数 得 到 的 VaR 可 以 充当 实际 VaR 的 一 个 下 界 . 


7.4.2 分 位 数 回 归 


在 实际 应 用 中 , 人 们 经 常 能 够 得 到 对 所 研究 问题 的 非常 重要 的 解释 变量 . 例如 ， 
美国 联邦 储备 银行 对 利率 采取 的 行动 对 美国 股票 的 收益 率 具有 重要 的 影响 . 从 而 考 
虑 分 布 函数 rl FOX. F, 包含 了 这 个 解释 变量 ) 更 加 恰当 . 换 句 话说 , 我 们 对 给 
E 有 下 regs 的 分 布 函数 感 兴趣 . 这 样 一 个 分 位 数 在 文献 中 常 称 之 为 回归 分 位 数 
具体 可 以 参见 Koenker 和 Bassett(1978). 

为 了 理解 回归 分 位 数 , 将 前 一 小 节 中 的 经 验 分 位 数 看 作 一 个 估计 问题 是 有 益 
的 . 对 于 一 个 给 定 的 概率 p, {re} 的 p- 分 位 数 可 以 通过 下 式 得 到 
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Ip = again ) ,up(rs — p), 
其 中 Wy (z) 定义 为 
sli pz, 45. z >0, 
1 
回归 分 位 数 就 是 这 样 一 个 估计 的 一 般 化 . 
为 了 看 出 这 种 一 般 化 , 假定 我 们 有 线性 回归 
T£ = B'E + at, (7.13) 
其 中 B Æ k 维 参数 向 量 , zx， 是 预测 向 量 , IX RS DR I] FH. 的 元 素 . 因为 
B'az, 是 已 知 的 , 所 以 re 在 给 定 Fei 条 件 下 的 条 件 分 布 就 是 at 的 分 布 的 一 个 平移 . 
用 此 方式 看 待 这 个 问题 , Koenker Al Bassett (1978) 指出 re 在 给 定 Fii 条 件 下 的 
条 件 分 位 数 p| Fe 的 估计 为 


$y|Fi-1 = inf(85z|R, (B) = min}, (7.14) 
其 中 “Rj,(Bo) = min” 意 思 是 By 可 以 由 下 式 得 到 


n 
Bo = arg min wWy(re — 92). 
i t=1 


其 中 w,(-) 如 前 面 定义 . 得 到 这 样 一 个 估计 的 分 位 数 的 计算 机 程序 可 以 在 Koenker 
和 D'Orey (1987) 中 找到 . 


7.5 极 值 理论 


本 节 将 回顾 统计 文献 中 的 一 些 极 值 理论 . 用 mx 表示 某 资 产 以 一 个 给 定时 间 间 
隔 (如 天 ) 测量 的 收益 率 . 考虑 n 个 收益 率 的 集合 [r ,rn}. 该 集合 中 的 最 小 收 
ARH ra), 也 就 是 最 小 次 序 统计 量 ; 而 最 大 收益 率 no, 也 就 是 最 大 次 序 统计 量 . 
具体 来 讲 , ray = minigjes (rj); Tin) = maxig;entr;)- 因为 对 于 一 个 多 头头 寸 而 
言 , 最 小 收益 率 ra) 与 VaR 的 计算 是 高 度 相关 的 , 所 以 我 们 主要 讨论 ra) 的 性 质 . 
然而 , 所 讨论 的 理论 对 该 资产 在 给 定时 间 间 隔 上 的 最 大 收益 率 也 是 适用 的 , 因为 最 
大 收益 率 的 性 质 可 以 通过 最 小 收益 率 的 一 个 简单 的 符号 变化 得 到 . 具体 来 讲 , 我 们 
有 Tis) 一 min,;«;«a1 rj} = T) 其 中 Tí = —Tt, Ebr c 表示 符号 的 变化 . 最 大 
收益 率 与 持 有 一 个 空头 金融 头寸 有 关 . 
7.5.1 ” 极 值 理论 的 回顾 


假设 收益 率 r 是 序列 独立 的 , 其 通常 的 cdf 为 F(z) BKR re 的 变化 范围 
为 Lu]. 对 于 对 数 收 益 率 , 我 们 有 l= 一 00, u = oc. ro 的 cdf( 用 Fanale) 表示 ) 由 
下 式 给 出 
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Pax) —Pr[r() < E —1-— Pr[ra) > a] 
—-1-Pr(ri2,n ,--.z) 


=]— Il Pr(r; >a) (由 独立 性 ) 
j^71 


xd II [1 — Pr(r; € z)] 


ji 


-i-[[ü- ra] (由 通常 的 分 布 ) 


j=1 


-1- [1 — F(z)|". (7.15) 


在 实际 中 , r, 的 累积 密度 分 布 F(z) 是 未 知 的 . 因此 , ra) 的 累积 密度 分 布 Faal) 
也 是 未 知 的 .然而 , 当 n 赵 于 无 穷 时 , Fail) 变 成 退化 的 ， 即 当 n 趋 于 无 穷 时 ， 
E x <l, W Fale) —0; Fae > 1, W Fail) 一 1. 因为 这 个 退化 的 car 没有 实 
际 价值 , 所 以 极 值 理论 关心 的 是 寻找 两 个 序列 {Bs} 和 {an}( 其 中 an > 0), 满足 
ras) = (raj — Bn)/on 的 分 布 当 n 趋 于 无 穷 时 收敛 到 一 个 非 退 化 分 布 . 序列 An) 是 
一 个 位 置 序列 , {an} 是 尺度 因 了 序列 . 在 独立 性 假定 下 , 标准 化 的 最 小 收益 率 ra) 
的 极限 分 布 为 


F.(z) = 1 —exp|-(1-- kz)V*], Æ k #40, 
em t db se: exp|- exp(z)], 4 k=0. 


P k<0, 则 上 式 对 r«—1/k 成 立 ; 4 k > 0, MEZI s> —1/k 成 立 , 其 中 下 标 + 
表示 最 小 收益 率 .k — 0 的 情况 看 作为 天 一 0 时 的 极限 . 参数 k 称 为 形状 参数 . È 
控制 了 极限 分 布 的 尾行 为 . 参数 a = 一 1/k 称 为 分 布 的 尾 指 数 . 

方程 (7.16) 的 极限 分 布 是 Jenkinson (1955) 对 最 小 收益 率 的 一 般 极 值 分 布 . 它 
包含 了 Gnedenko (1943) 中 三 种 类 型 的 极限 分 布 . 

e 类 型 | k=0, Gumbel 族 , 其 cdf 为 


(7.16) 


F,(z) = 1 — exp[- exp(z)]， —oo < x «oo. (7.17) 
e 类 型 k — 0, Fréchet 族 , 其 cdf 为 
人 kr)/k| 35 z< —1/k, 
ke} { i Ér2 —1/k. 
e KAN 大 > 0, Weibull MATAR) Jk, 这 里 其 cdf 为 


4] L—exp[—(14 kz)V*], $ 2 > —1/k, 
Panne | 0, E x <—1/k. 


(7.18) 


264 第 7 章 极 值 理 论 、 分 位 数 估计 与 风险 值 


Gnedenko(1943) 给 出 了 与 上 面 的 三 种 类 型 极限 分 布 之 一 相 联 系 的 n. 的 cdf 
的 充 要 条 件 . 简要 地 讲 ，F(z) 的 尾行 为 决定 了 最 小 收益 率 的 极限 分 布 Fx. 5 
Gumbel 族 相 联系 的 分 布 的 ( 左 ) 尾 是 指数 衰减 的 ; 与 Fréchet 族 相 联系 的 分 布 的 
( 左 ) PE ARAY; 与 Weibull 族 相 联系 的 分 布 的 下 端点 是 有 限 的 (图 7-2). 对 
于 极 值 理论 的 全 面 讨 论 , 读者 可 以 参阅 Embrechts, Kuppelberg 和 Mikosch (1997). 
在 风险 管理 中 , 我 们 主要 对 Fréchet 族 感 兴趣 、 它 包含 了 平稳 分 布 和 学 生 t- 分 布 . 
Gumbel 族 包 含 了 如 正 态 分 布 、 对 数 正 态 分 布 等 薄 尾 分 布 . 方程 (7.16) 的 一 般 极限 
分 布 的 概率 分 布 密度 函数 (pat) 可 以 很 容易 地 通过 差分 得 到 : 


EA | (1+ kat) 5-1 exp|—(1 4. ka )!/k], F k #0, 


exp|r — exp(x)]. 若 大 = 0， 38) 


其 中 对 有 三 0, -oo < x< 00; XÍ k <0, x< -1/k; k»0,z» -1/k. 


,Frechet 
ni 


Weibull / | 


-10 —b5 0 5 10 
uz 


7-2 ”最 小 收益 率 的 极 值 分 布 的 概率 密度 函数 : 实 线 是 Gumbel 分 布 ; 点 虚 
Het k = 0.5 的 Weibull 分 布 ; 虚线 是 大 = —0.9 的 Fréchet 分 布 


前 面 提 到 的 极 值 理论 有 两 个 重要 的 应 用 . 第 一 , r 的 累积 密度 函数 Fl) 的 尾 
部 行为 (而 不 是 具体 的 分 布 ) 决定 了 (标准 化 的 ) 最 小 收益 率 的 极限 分 布 (c). 这 
FE, 此 理论 对 于 收益 率 re 的 一 个 广泛 的 分 布 范围 都 是 实际 可 行 的 . 然而 序列 {a} 
和 {an} 可 能 依赖 于 累积 密度 函数 F(x). 第 二 , Feller (1971, P. 279) 证 明了 尾 指数 
k 并 不 依赖 于 re 的 时 间 间 隔 . 也 就 是 说 , 尾 指数 (或 等 价 地 称 为 形状 参数 ) 在 时 间 
累积 下 是 不 变 的 . 极限 分 布 的 第 二 个 性 质 在 VaR 计算 中 变 得 可 以 利用 了 . 

极 值 理论 已 经 扩展 到 序列 相关 的 观测 值 (n) 4. 这 里 假定 这 种 相关 是 很 弱 的 . 
Berman(1964) 证 明了 假定 r, 的 自 相关 函数 是 平方 可 积 的 ( 即 Yo p2 < oc), 其 中 


p, 是 r 的 延迟 i 的 自 相关 函数 , 则 极限 极 值 分 布 的 同样 形式 对 平稳 的 正 态 序列 也 
成 立 . 关于 序列 相关 性 对 极 值 理论 的 影响 的 进一步 结果 , 读者 可 以 参考 Leadbetter, 
Lindgren 和 Rootzén (1983, 第 3 章 ). 
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7.5.2 ”经 验 估计 


极 值 分 布 包含 3 个 参数 ; k, Bp, on. 这 些 参数 分 别称 为 形状 参数 、 位 置 参数 和 
尺度 参数 . 它们 可 以 利用 参数 或 非 参数 方法 来 估计 , 下 面 我 们 回顾 一 些 估 计 方 法 . 

对 于 给 定 的 样本 , 只 有 一 个 单一 的 最 小 收益 率 或 最 大 收益 率 , 并 且 我 们 仅 用 - 
个 极端 观测 并 不 能 估计 这 三 个 参数 , 因此 必须 利用 另外 的 方法 . 文献 中 运用 的 一 个 
想法 就 是 将 样本 分 成 子 样 , 并 对 子 样 应 用 极 值 理 论 . 假定 共有 T 个 收益 率 {r}. 
我 们 将 样本 分 成 g 个 互 不 相交 的 子 样 , 且 每 个 子 样 有 n 个 观测 值 . 为 了 简便 , 假定 
T — ng. 换 句 话说 , 我 们 将 数据 分 为 

[rire Tal apr san Tort Tanl | Tug) 

并 将 观测 到 的 收益 率 记 为 rin4j, 其 中 1 < jn, i =0,-++,g—1. 注意 到 每 个 子 样 
对 应 于 数据 区 间 的 一 个 子 区 间 . 当 n 充分 大 时 , 我 们 希望 极 值 理 论 对 每 个 子 样 都 适 
Hl. 在 应 用 中 , n 的 选择 由 实际 情况 来 决定 . 例如 , 对 于 日 收益 率 , n = 21 近似 对 应 
于 一 个 月 内 的 交易 日 数量 ; n = 63 表示 一 个 季度 人 交易 日 的 数量 . 

È rni 表示 第 i 个 子 样 的 最 小 值 (BI. rni 指 第 i 个 子 样 中 的 最 小 收益 率 ), 其 
中 下 标 n 几 来 表示 子 样 的 大 小 ， 当 n 充分 大 时 ,zwi = (tai — BB,)/an 应 该 服从 一 
个 极 值 分 布 , 并 且 子 样 最 小 值 的 集合 (nli = 1,:… ,9} 可 以 认为 是 从 极 值 分 布 中 
抽取 的 g 个 观测 值 的 样本 . 具体 来 讲 , 我 们 定义 


Tni = min rt i16. (7.20) 


子 样 最 小 值 的 集合 {rni} 是 我 们 用 来 估计 极 值 分 布 未 知 参数 的 数据 . 显然 , 得 到 的 
估计 可 能 依赖 于 子 区 间 长 度 n 的 选择 . 


1. 参数 方法 

有 两 种 参数 方法 可 以 利用 最 大 似 然 法 和 回归 方法 . 

2. 最 大 似 然 法 

假定 子 区 间 最 小 值 {rni} 服从 一 般 的 极 值 分 布 , 满足 ri = (rni 一 把 )/a 的 
pdf 由 方程 (7.19) 给 出 , 我 们 可 以 通过 简单 的 转换 得 到 7,, ; 的 pdf 为 


1 ky na ^ "n cs kn ni "n Win 


Og Om 


1 "nat — B. ui — Bn 
epf Pe — exp [TA], Æ ka = 0, 
o An Gn 


f(rn ) = 


其 中 ， 若 Kn 天 0, 则 1 e kn (Tni 2l Bn) [On > 0. 形状 参数 k 中 加 入 下 标 nh, 表示 它 的 
估计 依赖 于 n 的 选择 . 在 独立 性 假定 下 , 于 区 间 最 小 值 的 似 然 函数 为 


g 
Pai >? niieg Kiss Gn n) = [Lf (rais)- 


i=1 
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可 以 利用 非 线性 估计 程序 来 得 到 kn Gn 和 an 的 最 大 似 然 估 计 . 这 些 估 计 是 无 偏 
的 , ADEESH, 且 在 适当 的 假设 下 具有 最 小 方差 . 详细 情况 可 参见 Embrechts 等 
(1997) 和 Coles(2001). 稍 后 我 们 对 一 些 股 票 收 益 率 序列 应 用 这 些 方法 . 

3. 回归 方法 

此 方法 假定 {rni} 是 从 方程 (7.16) 的 般 极 值 分 布 中 抽取 的 一 个 随机 样本 ， 
并 且 利用 了 次 序 统 计量 的 性 质 . 参见 Gumbel(1958). 将 子 区 间 最 小 值 {rmi}#_) 的 
次 序 统计 量 表示 为 


Tn(1) S Tn(2) S *** S Tn(g): 
利用 次 序 统 计量 的 性 质 (例如 Cox 和 Finley, 1974, P. 467), 我 们 有 
E(F.[ra()]) = rere i= Lg, (7.21) 


为 了 简便 , RATRI k 的 值 分 为 两 种 情形 讨论 . 首先 , SIE k AO 的 情形 .由 方程 
(7.16), 我 们 有 
pase) Ex 1/kr, 
Flray]=1 -of - d } (7.22) 


Om 


因此 , 利用 方程 (7.21) 和 方程 (7.22) 以 及 观测 值 的 渐 近 期 望 , 我 们 有 


| nlii) 9n Ln 
: -icep[- udi } 
gil On 
因此 ， 


“n(a — Bn L/ kn l 1—3 


n g+1 g+1 
连续 两 次 取 自 然 对 数 , 前 面 的 方程 给 出 


g+1-i 1 na] 
in [1 ( = Jag pre Em | T *T Ne. 
实际 中 , > e; 表示 前 面 两 个 量 之 间 的 偏 移 , 并 假设 {ei} 不 是 序列 相关 的 , 则 我 们 有 
一 个 回归 步骤 


—i nli) 一 dà 
In |- (22255) => tm 9 ue, i Lovee g (7.23) 
可 以 通过 最 小 化 Ei 的 平方 和 来 得 到 Kiss, Bre 与 On 的 最 小 二 乘 估计 . 

当 kn = 0 时 , 回归 的 建立 简化 为 


g--1—i 1 8 y 


最 小 二 乘 估计 是 相合 的 , 但 比 最 大 似 然 估 计 的 有 效 性 低 . 本 章 将 利用 最 大 似 然 估 计 . 


7.5 极 值 理论 267 


4. 非 参 数 方法 

ERZEK k 可 以 利用 一 些 非 参数 方法 来 估计 . 这 里 我 们 将 讨论 两 种 这 样 的 方 
YE. 这 两 种 方法 是 由 Hill (1975) 和 Pickands (1975) 提出 的 , 分 别称 之 为 Hill 估计 
和 Pickands 估计 . 将 两 种 估计 都 直接 应 用 到 收益 率 (n)7., 上 . 因此 就 没有 必要 考 
虚 子 样 了 . 将 样本 的 次 序 统 计量 表示 为 


ra) ST) Ss S r(T). 


令 4 ATER, W k 的 两 个 估计 定义 为 


| 
jp(g) = mO) In | ous f as (7.24) 
- = 
kala) = FI 2 [In[77(4] = In[-7(444)]); (7.25) 
i=1 


其 中 变量 (q) AKRE RE og. Hill 估计 和 Pickands 估计 之 间 的 q 的 选 
择 是 不 同 的 . 几 个 研究 者 已 经 调查 过 4 的 选择 问题 , 但 是 还 没有 得 到 一 般 的 对 于 
可 以 利用 的 最 好 选择 的 结论 ， Dekkers 和 De Haan (1989) 证 明 : 对 样本 容量 T, 如 
SR 9 在 一 个 恰当 的 选择 间隔 上 是 增加 的 , 则 kola) 是 相合 的 . 男 外, 他 们 还 证 明了 
Valkp(q) — k] 是 渐 近 正 态 的 , 且 均 值 为 0. 方差 为 Kk? (27? 4 1)/[2(2-* — 1) In(2)]?. 
Hill 估计 仅仅 对 Fréchet 族 是 适用 的 , 但 当 它 适用 时 , 它 比 Pickands 估计 更 有 效 . 
Goldie 和 Smith (1987) 证 明 J/g[ks(q) — k] 是 渐 近 正 态 的 , 且 均 值 为 0、 方差 为 2. 
实际 中 , 可 以 画 出 Hill 估计 kala) 对 q 的 图 形 , 并 旦 寻找 一 个 恰当 的 gq 使 得 估计 是 
稳定 的 . 可 以 用 估计 的 尾 指数 a = 一 1/kn(q) 来 得 到 收益 率 序 列 的 极 值 分 位 数 . 参 
Ji, Zivot 和 Wang(2003). 


7.5.3 ”对 股票 收益 率 的 应 用 


我 们 对 IBM 股票 从 1962 年 7 月 3 日 至 1998 年 12 月 31 日 的 日 对 数 收益 率 
应 用 极 值 理论 . 收益 率 用 百分比 测量 , 且 样 本 量 为 9 190(B T = 9 190). 图 7-3 显 
示 了 当 子 区 间 的 长 度 为 21 天 时 , 极端 日 对 数 收 益 率 的 时 间 图 形 , 这 近似 对 应 于 一 
个 月 . 从 图 中 可 以 清楚 地 看 到 1987 年 10 月 的 股市 崩盘 . 排除 1987 年 的 股市 崩盘 ， 
极端 日 对 数 收 益 率 的 范围 是 0.59638]. 13%. 

X 7-1 概 插 了 由 Hill 估计 得 到 的 形状 参数 为 的 一 些 估计 结果 . 此 表 显 示 对 
所 给 的 q 的 三 种 选择 , 结果 都 是 稳定 的 . 为 了 对 Hull 估计 的 表现 提供 一 个 全 面 的 概 
况 , 图 7-4 显示 了 Hill 估计 (gq) 对 q 的 离散 图 . 对 正 的 和 负 的 极端 日 对 数 收 益 率 ， 
Uk Y oq 很 小 的 情形 , 估计 都 是 稳定 的 . 估计 的 形状 参数 大 约 是 —0.30, 在 渐 近 5%7K 
平 下 其 显著 地 不 同 于 0. 图 形 也 说 明了 对 于 负极 端 值 , 形状 参数 及 看 上 去 很 小 , 隐 
含 了 日 对 数 收益 率 可 能 有 一 个 更 厚 的 左 尾 . 总 之 , 结果 说 明 IBM 股票 的 日 对 数 收 
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(a) 月 最 大 对 数 收 益 率 
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图 7-3 “4 PRM 21 个 交易 日 时 , IBM 股票 的 最 大 与 最 小 日 对 数 收 益 率 . 数据 区 间 从 
1962 Æ 7 H 3 HÆ 1998 年 12 H 31 H: (a) 正 收益 ; (b) 负 收 益 
益 率 的 分 布 属于 Fréchet WR. 这 样 , 该 分 析 拒 绝 了 实际 中 通常 采用 的 正 态 性 假定 . 这 
个 结论 与 Longin (1996) 是 一 致 的 , 他 当时 利用 了 美国 股票 市 场 指数 序列 . 在 S-Plus 
中 , 可 以 用 命令 hill 来 得 到 Hill 估计 , 例如 


ibm.hill = hill (ibm, option='xi’ ,end=500). 


X 7-1 IBM 股票 从 1962 7A 3 日 至 1998 年 12 A 31 日 的 日 对 数 收 益 率 Hill 


估计 的 结果 ” 
q 190 200 210 
最 大 值 —0.300(0.022) —0.297(0.021) —0.303(0.021) 
最 小 值 —0.290(0.021) —0.292(0.021) —0.289(0.020) 
a 括号 内 的 数 为 标准 误差 ， 


(a) 上 尾 ( 右 尾 ) 


Hill 


0 100 200 300 400 500 
4 
(b) 下 尾 ( 左 尾 ) 
E -06 


0 100 200 300 400 500 
4 


图 74 IBM 股票 日 对 数 收益 率 Hill 估计 的 散 点 图 . 子 样 区 间 从 1962 年 7 月 3 日 至 
1998 年 12 月 31 H: (a) 正 收益 ; (b) 负 收 益 
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下 面 我 们 对 IBM 股票 的 日 对 数 收 益 率 应 用 最 大 自然 法 来 估计 一 般 极 值 分 布 的 
BR. 对 于 子 区 间 长 度 从 1 个 月 (n= 21) 8J 1 4E (n = 252) 的 变化 范围 , Ze 7-2 概 
括 了 不 同 选择 的 估计 结果 . 由 此 表 , 我 们 做 出 以 下 观测 结果 . 
e. 74 n 增加 时 , 位 置 参数 8， 和 尺度 参数 os, 的 估计 的 绝对 值 是 递增 的 . 这 是 
可 以 预料 的 , 因为 子 区 间 最 小 值 和 最 大 值 的 期 望 量 值 是 ”的 不 减 函 数 . 

e 4n>63 时 , 形状 参数 (或 等 价 于 尾 指数 ) 的 估计 对 于 负 的 极 值 是 稳定 的 ， 
近似 为 —0.33. 

e 形状 参数 的 估计 对 正极 值 不 那么 稳定 . 这 个 估计 在 数量 上 很 小 , 但 仍 显著 不 
同 于 0. 

。 AA n = 252 的 子 区 间 g 的 长 度 相 当 小 , 所 以 其 结果 具有 高 度 可 变性 . 

得 到 的 这 个 结果 又 类 似 于 Longin (1996) 的 结论 , 他 对 将 极 值 理论 应 用 到 股票 市 场 
收益 率 的 分 析 提 供 了 一 个 很 好 的 解释 . 

A 7-2 的 结果 是 由 Richard Smith 教授 所 开发 的 Fortran 程序 (作者 做 了 一 
定 的 修改 ) 得 到 的 .也 可 以 用 S-Plus 来 进行 上 述 估计 . 下 面 演 示 了 在 分 析 子 周期 
为 21 个 交易 日 的 最 小 收益 率 时 用 到 的 命令 . 注意 收益 率 均 乘 以 了 一 100, 因为 (a) 
S-Plus 主要 讨论 分 布 的 右 尾 ; (b) 收益 率 以 百分比 的 形式 给 出 . Ah, S-Plus 中 的 
(xi, sigma, mu) 分 别 对 应 表 中 的 (一 ian:D). 由 S-Plus 得 到 的 估计 与 表 7-2 中 
的 很 接近 . 

表 7-2 对 IBM 股票 从 1962 年 7 月 3 日 至 1998 年 12 月 31 日 
的 日 对 数 收 益 率 极 值 分 布 的 最 大 似 然 估计 = 


了 区 间 长 度 


1 个 月 (n=21, g=437) 

1 季度 (n=63, g=145) 

6 个 月 (n=126, g=72) 
1 年 (n=252, g=36) 


1 4H (n=21, g=437) 

1 季度 (n=63, g=145) 

6 个 月 (n=126, g=72) 
1 年 (n=252, y=36) 


a 括号 内 的 数值 为 慰 准 误差 . 


GEV 估计 的 S-Plus 演示 
收益 率 序列 是 ibm. 


>length (ibm) 
[1] 9190 


尺度 On 


最 小 收益 


0.823(0.035) 
0.945(0.077) 
1.147(0.131) 
1.542(0.242) 


最 大 收益 


0.931(0.039) 
1.157(0.087) 
1.292(0.158) 
1.624(0.271) 


位 置 Bn 


—1.902(0.044) 
—2.583(0.090) 
—3.141(0.153) 
—3.761(0.285) 


2.184(0.050) 
3.012(0. 108) 
3.471(0.181) 
4.475(0.325) 


形状 参数 kn 


—0.197(0.036) 
—0.335(0.076) 
—0.330(0.101) 
—0.322(0.127) 


—0.168(0.036) 
—0.217(0.066) 
—0.349(0.130) 
—0.264(0.186) 
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>grp=floor (9190/21) 
>gIP 
[1] 437 
>for(i in 1:grp){ 
+jend=9190-(i-1)*21 
+jst=jend-21+1 
+xmin[i]=min(ibm[jst:jend]) 
+} 
>y=xmin* (-100) 
»nibm.gev.21-gev(y) 
>names (nibm. gev .21) 
[1] "nell" "n" "call" "block" "data" 
[6] "par.ests"  "par.ses" "varcov" "converged" "nllh.final" 
>nibm.gev.2i$par.ests 

xi sigma mu 
0.1953325 0.8187631 1.921797 
»nibm.gev.21$par.ses 

xi sigma mu 

0.03539358 0.03456347 0.04387343 

»plot(nibm.gev.21) 
Make a plot selection (or O to exit): 
1: plot: Scatterplot of Residuals 
2: plot: QQplot of Residuals 
Selection: 


0 100 200 300 400 0 1 4 LS 
序列 序列 数 


图 75 给 IBM 股票 的 负 的 日 对 数 收 益 率 拟 合 GEV 分 布 时 的 残 差 图 . 数据 的 时 间 区 间 
是 从 1962 年 7 月 3 日 到 1998 年 12 H 31 日 .数据 以 百分比 形式 给 出 , HTC 
间 长 度 是 21 个 交易 日 
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定义 所 拟 合 的 GEV 分 布 的 残 差 是 
S lkn 
— (1 ih o) 


利用 GEV 分 布 的 概率 密度 函数 以 及 变量 的 变换 , 可 以 很 容易 证 明 : 如 果 所 拟 合 的 
模型 是 正确 的 , 则 {wi} 应 该 是 一 列 独立 同 指数 分 布 的 随机 变量 . 图 7-5 显示 了 给 
IBM 股票 的 负 的 日 对 数 收益 率 拟 合 GEV 分 布 时 的 残 差 图 , 子 周 期 长 度 是 21 个 交 
易 日 . 左边 的 图 给 出 了 残 差 , 右边 的 图 给 出 了 对 指数 分 布 的 QQ A, 图 像 表 明 拟 合 
是 合理 的 . 


7.6 VaR 的 极 值 方法 


本 节 将 讨论 利用 极 值 理论 的 VaR 计算 方法 ， 该 方法 类 似 于 Longin (1999a, 
1999b), 他 出 于 同样 的 目的 提出 了 一 个 八 步 程序 . 我 们 将 讨论 分 为 两 个 部 分 . 第 一 
个 部 分 关心 的 是 利用 7.5 节 讨 论 的 方法 得 到 的 参数 估计 ; 第 二 个 部 分 通过 将 感 兴趣 
的 概率 与 不 同 的 时 间 区 间 相 联系 , 集中 讨论 VaR 计算. 

第 一 部 分 

假设 样本 区 间 上 可 以 利用 的 资产 收益 率 有 个 观测 值 . 我 们 将 样本 区 间 分 解 
为 g 个 互 不 相交 的 长 度 为 n 的 子 区 间 , HA T= ng. MRT =ng+m,1<m<n, 
那么 我 们 将 前 m 个 观测 值 从 样本 中 删除 . 7.5 节 中 讨论 的 极 值 理论 使 我 们 能 够 得 到 
对 子 区 间 的 最 小 值 {rp} 的 位 置 参数 ba RESH an 以 及 形状 参数 kn 的 估计 . 
将 最 大 似 然 估计 代入 方程 (7.16) 的 cdf, 其 中 , z = (r — B,)/on, 则 我 们 可 以 得 到 一 
般 极 值 分 布 在 给 定 概率 下 的 分 位 数 . 因为 我 们 集中 于 讨论 持 有 多 头 金 融 头 寸 , 所 以 
感 兴趣 的 是 下 (RE) 分 位 数 . 令 p 为 一 个 小 概率 . 它 表 示 一 个 多 头头 寸 的 潜在 损 
失 超 过 一 定 限度 的 可 能 性 , 且 ;为 子 区 间 最 小 值 在 极限 为 一 般 极 值 分 布 条 件 下 的 
p* — 分 位 数 , 则 我 们 有 


TUM 1/ks 
i-em | (11 56-2) | 车 ks #0, 


An 
p = 


1 — exp -en (8A), 车 k, = 0. 


这 里 可 以 理解 为 ， 对 于 kn # 0, A i4 Ky (77, 一 Bn)/ omn > 0. 将 这 个 方程 改写 为 


As We 1/ky 
本 | + Karo 2 若 kn #0, 
In(1 —p*) = 


~exp | 3-5], 车 kn = 0. 
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我 们 得 到 分 位 数 为 
l i = ii ~[—In(1— p*)|*"}, $F kn 40, 
EX n (7.26) 
Bn + a, In[- In(1 — p*)}, Ti ky, — 0. 
在 金融 应 用 中 , 主要 感 兴趣 的 就 是 Ks AO 的 情形 . 
第 二 部 分 


对 于 一 个 给 定 的 下 尾 (或 左 尾 ) 概率 pt. 方程 (7.26) 的 分 位 数 r* 就 是 在 对 子 
区 间 最 小 值 的 极 值 理论 基础 上 计算 的 VaR. 下 一 步 就 是 制定 子 区 间 最 小 值 与 观测 
的 收益 率 序列 re 之 间 的 明确 关系 . 

因为 大 部 分 资产 收益 率 或 者 是 序列 无 关 的 , 或 者 有 很 弱 的 序列 相关 性 , 所 以 我 
们 可 以 利用 方程 (7.15) 的 关系 , 得 到 


p-Pí(r.i&Tr,)-1-[1— P(r & rz)]" 


或 等 价 地 

1—75' = L- Pin rl". (7.27) 
概率 之 间 的 这 种 关系 允许 我 们 得 到 原始 的 资产 收益 率 序列 n, 的 VaR. 更 精确 地 讲 ， 
对 于 一 个 特定 的 很 小 的 下 尾 概 率 p, WR p* 是 根据 方程 (7.27) 选择 的 , DU re 的 p 


分 位 数 是 rf, 其 中 p= P(r < ri) 因此 , 对 给 定 的 小 概率 p, 持 有 一 个 对 数 收益 率 
Air, 的 标的 资产 , 其 多 头头 寸 的 VaR 为 


| Bn - 2% (1—[-nin(1 - p^), AF ka £0, 


Bn 十 ar In[—n In(1 — p)], E kn =0, 


VaR = (7.28) 


其 中 n 是 子 区 间 的 长 度 . 
小 结 


我 们 将 应 用 传统 的 极 值 理 论 来 计算 VaR 的 方法 概括 如 下 : 

(1) 选择 子 区 间 的 长 度 n, 并 得 到 子 区 间 的 最 小 值 {raih i — 1,---.9, 这 里 
g = [T/n]; 

(2) 得 到 8,, an H k,, 的 最 大 似 然 估 计 ; 

(3) 检查 拟 合 的 极 值 模 型 的 充分 性 , 可 参见 下 一 节 中 模型 检验 的 一 些 方法 ; 

(4) 如 果 极 值 模 型 是 充分 的 , 则 可 应 用 方程 (7.28) 计算 VaR. 

注释 : ”因为 我 们 集中 于 讨论 持 有 一 个 多 头 金 融 头 寸 , 即 讨论 收益 率 分 布 的 左 
尾 分 位 数 , 因此 , 分 位 数 是 负 的 . 然而 , 实际 中 习惯 于 利用 一 个 正 数 来 计算 VaR, 这 
TR. 在 利用 方程 (7.28) 时 , 应 该 意识 到 负 号 代表 一 个 损失 . 口 
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$l 7.6 ”考虑 IBM 股票 从 1962 年 7 月 7 日 至 1998 年 12 H 31 日 ,以 百分比 表示 
的 日 对 数 收益 . 由 表 7-2, 对 n= 63, 我 们 有 ân = 0.945, Ên = —2.583, Ån = —0.335. 
因此 , 对 左 尾 概率 p — 0.01, 相应 的 VaR 为 
0.945 
一 0.335 
= —3.049 69. 


这 样 , 对 于 股票 的 日 收益 率 , 1% 分 位 数 是 一 3.049 69. 如 果 某 人 持 有 这 只 股票 价值 1 
干 万 美元 的 一 个 多 头头 寸 , 则 概率 19585 VaR 估计 为 10 000 000x0.030 496 9 美元 = 
304 969 美元 . 如 果 概 率 是 0.05, 则 相应 的 VaR 为 166 641 美元 . 
如 果 我 们 选择 n=21( 即 近似 于 1 SA), 那么 à, = 0.823, Ên = —1.902, 
kn = 一 0.197, 极 值 分 布 的 1% 分 位 数 为 
0.823 
—0.197 


所 以 , 对 于 一 个 1 千 万 美元 的 多 头头 寸 , 在 1% 风 险 水 平 上 对 应 的 1 天 持 有 期 的 VaR 
为 340 013 美元 . 如 果 概 率 是 0.05, 则 对 应 的 VaR 为 184 127 美元 . 在 这 个 特殊 的 
情形 , n=21 的 选择 给 出 了 更 高 的 VaR fi. 

例 7.6 中 用 极 值 理论 得 到 的 VaR 值 小 于 例 7.3 中 用 GARCH(1,1) 模型 得 到 的 
VaR 值 , 这 一 点 有 些 奇 怪 . 事实 上 , 例 7.6 中 的 VaR 值 甚至 小 于 例 7.5 中 根据 经 验 
分 位 数 得 到 的 VaR 值 . 出 现 这 种 情况 的 部 分 原因 是 由 于 概率 为 0.05 的 选择 . 如 果 
某 人 选取 概率 为 0.001=0.1%% ,并 考虑 同样 的 金融 头寸 , 那么 我 们 有 n = 21 时 , 对 
高 斯 AR(2)-GARCH(1,1) 模型 , VaR=546 641 美元 ; 对 于 极 值 理论 有 VaR=666 590 
美元 . 而 且 , 这 里 通过 传统 的 极 值 理 论 得 到 的 VaR 可 能 并 不 充分 , 因为 统计 检验 经 
常 拒绝 了 日 对 数 收益 率 的 独立 性 假定 . 最 后 , 子 区 间 最 小 值 的 应 用 忽视 了 日 对 数 收 
益 率 中 波动 率 聚 类 的 事实 . 7.7 节 将 要 讨论 的 极 值 理论 的 新 方法 克服 了 这 些 缺 点 . 

注释 : 4 7.6 中 的 结果 显示 , 根据 传统 的 极 值 理论 计算 的 VaR RMF n 的 
选择 , 其 中 nn 表示 子 区 间 的 长 度 . 因为 极限 的 极 值 分 布 成 立 , 所 以 应 该 选择 一 个 大 
n. 但 是 当 样 本 量 了 固定 时 , 一 个 大 n 意味 着 一 个 小 g, 其 中 g 为 估计 三 个 参数 an, 
Bn 和 kn 时 运用 的 有 效 样 本 量 . 因此 , SERA n 与 g 的 选择 中 作 一 些 妥 协 . 应 根据 
所 研究 资产 的 收益 率 给 出 一 个 恰当 的 选择 . 我 们 建议 在 运用 传统 的 极 值 理论 时 ,应 
该 检验 结果 中 VaR 的 稳定 性 . E 


7.6.1 讨论 


我 们 已 经 对 一 个 1 千 万 美元 的 多 头头 寸 中 的 IBM 股票 日 对 数 收益 率 的 VaR 
计算 运用 了 各 种 不 同 的 方法 .考虑 下 一 个 交易 日 头寸 的 Van. 如 果 概 率 是 5%, 这 
意味 着 在 下 一 个 交易 日 中 , 损失 将 以 概率 95% 低 于 或 等 于 VaR, 则 得 到 的 结果 为 : 


VaR = —2.583 一 


{1 — [763 In(1 一 0.01)] 一 0.335} 


VaR — —1.902 一 


{1 — [-211n(1 — 0.01)]-9-197) = —3.400 13. 
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(1) 对 于 风险 度量 制 , 为 302 500 美元 ; 

(2) 对 高 斯 AR(2)-GARCH(1,1) 模型 , 为 287 200 美元 ; 

(3) 对 和 白 由 度 为 5 的 标准 化 学 生 t 分 布 的 AR(2)GARCH(1,) 模型 ， 为 
283 520 美元 ; 

(4) 对 运用 经 验 分 位 数 时 , 为 216 030 美元 ; 

(5) 对 利用 月 最 小 值 ( 即 子 区 间 长 度 n=21) 并 运用 传统 的 极 值 理论 方法 时 , 为 
184 127 美元 . 

如 果 概 率 为 196, 则 VaR 为 

(1) 对 于 风险 度量 制 , 为 426 500 美元 ; 

(2) 对 高 斯 AR(2-GARCH(1,1) 模型 , 为 409 738 美元 ; 

(3) 对 自由 度 为 5 的 标准 化 学 生 t+ 分 布 的 AR(2)-GARCH(1,1) 模型 ， 为 
475 943 美元 ; 

(4) 对 运用 经 验 分 位 数 时 , 为 365 709 美元 . 

(5) 对 利用 月 最 小 值 ( 即 子 区 间 长 度 n—21) 并 运用 传统 的 极 值 理论 方法 时 , 为 
340 013 美元 . 

如 果 概 率 为 0.1%, 则 Van. ZH 

(1) 对 于 风险 度量 制 , 为 566 443 美元 ; 

(2) 对 高 斯 AR(2)-GARCH(1,1) 模型 , 为 546 641 美元 ; 

(3) 对 自由 度 为 5 的 标准 化 学 生 c 分 布 的 AR(2-GARCH(11) 模型 ， 为 
836 341 美元 ; 

(4) 对 运用 经 验 分 位 数 时 , 为 780 712 美元 . 

(5) 对 利用 月 最 小 值 ( 即 子 区 间 长 度 n=21) 并 运用 传统 的 极 值 理 论 方法 时 , 为 
666 590 美元 . 

不 同方 法 间 有 着 不 小 的 区 别 . 这 并 不 令 人 惊奇 , 因为 在 估计 统计 分 布 的 尾行 为 
时 存在 较 大 的 不 确定 性 . 由 于 没有 真实 的 可 以 得 到 的 VaR 来 比较 不 同方 法 的 精度 ， 
我 们 建议 运用 几 种 方法 来 获得 Van. 的 一 个 范围 . 

尾 概率 的 选择 在 VaR 计算 中 也 起 着 重要 的 作用 . 对 于 IBM 股票 的 日 收益 率 ， 
因为 样本 量 为 9 190, 使 得 5901 1 名 的 经 验 分 位 数 都 是 收益 率 分 布 的 分 位 数 的 适当 
估计 . 在 这 种 情形 下 , 我 们 可 以 将 基于 经 验 分 位 数 的 估计 结果 当 作 真实 VaR 的 一 个 
保守 估计 ( 即 一 个 下 界 ). 以 这 个 观点 ,对 IBM 股票 的 日 对 数 收益 率 而 言 , 基于 传统 
极 值 理论 的 方法 看 上 去 低估 了 VaR. 下 一 节 将 要 讨论 的 条 件 极 值 理 论 的 方法 就 克 
服 了 这 个 缺点 . 

当 尾 机 率 很 小 (例如 0.1%) 时 , 经 验 分 位 数 是 真实 分 位 数 的 一 个 不 太 合 理 的 估 
th. 基于 经 验 分 位 数 的 VaR 不 能 再 充当 真实 VaR 的 一 个 下 界 . 最 后 , 前 面 的 结果 
很 清楚 地 说 明 当 尾 概 率 很 小 时 , 在 VaR 计算 中 运用 了 厚 尾 分 布 的 效应 . 在 概率 为 
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0.1968, 基于 自由 度 为 5 的 学 生 t- 分 布 的 VaR 或 基于 极 值 分 布 的 VaR 都 高 于 基 
于 正 态 假定 下 的 VaR. 


7.6.2 多 期 VaR 
风险 度量 制 方法 的 时 间 平 方 根 法 则 变 成 了 运用 极 值 理论 时 的 一 个 特殊 情形 . 1 
天 持 有 期 与 1 天 持 有 期 之 间 的 关系 为 
VaR(I) = 1'/°VaR = (~*VaR, 


其 中 a 是 尾 指 数 , k 是 极 值 分 布 的 形状 参数 . 具体 可 参见 Danielsson 和 de Vries 
(1997a). 这 个 关系 称 为 时 间 w 根 法 则 , 这 里 a 二 3 且 不 是 尺度 参数 os. 
为 了 解释 , 考虑 例 7.6 中 IBM 股票 的 日 对 数 收益 率 . 如 果 我 们 用 p = 0.05 以 
及 n= 21 的 结果 , 则 对 30 天 持 有 期 , RANA 
VaR(30) = (30) 59 VaR = 3.125 x 184 127 美元 = 575 397 美元 . 
因为 19-985 < 195. 则 时 间 o- 根 法 则 产生 了 比 时 间 平 方 根 法 则 更 低 的 ! 天 持 有 期 的 
VaR. 
7.6.3 ”空头 头寸 的 VaR 
本 小 节 将 给 出 持 有 一 个 空头 头寸 的 VaR 计算 公式 . 这 里 感 兴趣 的 是 子 区 间 的 
最 大 值 , 并 量 极 限 的 极 值 分 布 变 为 
D uc. 1/ kn 
cof- fi- 2t] |}. ao 
Fs) = 


On 


exp |- exp (728) i 车 ky =0, 


Oy 
其 中 + 表示 子 区 间 的 最 大 值 , 这 里 对 ks. A 0, 可 以 理解 为 有 1 一,(r 一 Bi)/a > 0. 
与 多 头头 寸 的 程序 类 似 , 我 们 得 到 收益 率 re 的 (1 — p)— 分 位 数 为 
Bn +=" di- pnia- p), 35 &, 4 0, 
— m {1 - [-nin — p) } 
Bn 十 an In{[—n In(1 — p)], 45k, = 0, 
其 中 p 是 一 个 小 概率 , 表示 持 有 一 个 空头 头寸 时 损失 的 机 会 . n 是 子 区 间 的 长 度 . 
7.6.4 KERKE 


基于 子 区 间 极 值 理 论 的 苏 外 一 个 风险 度量 是 收益 率 水 平 . 9 个 长 度 为 n 的 子 
区 间 的 收益 率 水 平 Lys 定义 为 这 样 一 个 水 平 : 该 长 度 为 的 子 区 间 中 有 1/9 个 超 
过 了 该 水 平 . 即 


(7.29) 


(7.30) 


1 
P(t ns < Eng) = 3° 
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其 中 rw 表示 子 区 间 的 最 小 值 . 收益 率 水 平 所 超过 的 那个 子 区 间 称 为 重点 区 间 
(stress period)， 如 果子 样本 区 间 足 够 大 使 得 标准 化 后 的 rai 服从 GEV 分 布 , W 
收益 率 水 平 为 


Lng = Bn + F {l-h — 1/g)^ — 1}, 


上 式 中 假定 kn A 0. 注意 , 这 是 由 (7.26) 式 所 给 出 的 极 值 分 布 的 精确 分 位 数 , 尾 概 
率 为 p* = 1/g, 它们 只 是 在 书写 的 形式 上 有 所 不 同 . 因此 , 收益 率 水 平 是 应 用 到 子 
区 间 的 最 小 值 (或 最 大 值 ) 而 不 是 标的 收益 率 本 身 . 这 也 正 是 VaR 与 收益 率 水 平 的 
区 别 所 在 . 

对 于 子 区 间 长 度 为 21 天 的 IBM 股票 的 负 的 日 对 数 收 益 率 , 我 们 可 以 用 所 拟 
合 的 模型 得 到 12 个 这 种 子 区 间 ( 即 , g = 12) 的 收益 率 水 平 为 —4.4835%. 
计算 收益 率 水 平 的 S-Plus 命令 


> r1.21.12=rlevel.gev(nibm.gev.21, k.blocks-12, 
+ type-'profile') 

> class(rl.21.12) 

(1] "list" 

> names(r1.21.12) 

[1] "Range"  "rlevel" 

» rl.21.12$rlevel 

[1] 4.483506 


在 S-Plus 中 , 子 区 间 的 数量 由 k. blocks 表示 , 子 命 令 type=‘profile’ 产生 收 
益 率 水 平 对 数 似 然 置信 区 间 的 概 图 . 该 图 并 没有 在 这 里 给 出 . 类 型 的 另外 一 个 子 命 
令 是 type-'RetLevel' 

如 果 用 子 区 间 的 最 大 值 , 则 收益 率 水 平定 义 为 P(rn; > Lng) = 1/g, 其 中 rni 
表示 子 区 间 的 最 大 值 . 同样 , 最 大 值 利用 GEV 分 布 , 我 们 得 到 


Lng = Bn + x - [- In(1 — /g)**), 


其 中 9 为 子 区 间 的 数量 . 


7.7 ”基于 极 值 理论 的 一 个 新 方法 


前 面 提 到 的 利用 极 值 理 论 计算 VaR 的 方法 遇 到 了 一 些 困 难 . 首先 , 于 区 间 长 
HE n 的 选择 并 没有 给 出 清楚 的 定义 . 其 次 , 该 方法 是 无 条 件 的 , 从 而 没有 考虑 其 他 
解释 变量 的 影响 . 为 了 克服 这 些 困难 , 统计 文献 中 已 丝 提 出 了 极 值 理论 的 坝 代 方 法 . 
具体 可 参见 Davison 和 Smith (1990) 以 及 Smith (1989). 新 方法 并 不 着 重 于 讨论 
极 值 (最 小 值 或 最 大 值 ), 而 是 着 重 讨 论 对 某 个 高 门限 的 超出 量 和 超出 发 生 的 时 间 . 
因此 该 新 方法 也 称 为 超出 门限 的 巍 (peaks over threshold (POT)) . 例如 , 考虑 本 章 
中 所 用 到 的 IBM 股票 的 日 对 数 收益 率 , 以 及 持 有 该 股票 的 一 个 多 头头 寸 . 令 n 表 
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示 一 个 指定 的 高 门限 . 我 们 可 以 选择 n = -2.5%. 假设 第 i 次 超越 在 第 t 天 发 生 
(BI ry. <n), 则 新 方法 集中 于 讨论 数据 (t.r — n), 其 中 n, — 为 超过 门限 y 的 超 
越 量 , 且 t 表示 第 ;次 超越 发 生 的 时 间 . 类 似 地 , 对 一 个 空头 头寸 , 我 们 可 以 选择 
7 = 2%, 并 讨论 数据 (tira — n), 这 里 fi > h. 

实际 中 , 发 生 时 间 (0) 提供 了 关于 重要 的 “稀少 事件 "( 如 对 多 头头 寸 而 言 低 于 
门限 7) 出 现 强度 的 有 用 的 信息 . i 的 一 个 聚 类 表示 了 一 个 大 的 市 场 低 迷 期 . 超越 
量 r, 一 9 也 很 重要 , 因为 它 提 供 了 我 们 感 兴趣 的 实际 量 . 

根据 前 面 的 介绍 , 新 方法 并 不 要 求 对 子 区 间 长 度 ”的 选择 ， 但 是 它 要 求 指定 一 
个 门限 n. 门限 0 的 不 同 选择 将 导致 形状 参数 &( 从 而 尾 指数 —1/k) 的 不 同 估计 . 在 
文献 中 , 一 些 研究 者 相信 n 的 选择 既是 一 个 统计 问题 , 又 是 一 个 金融 问题 , 它 不 能 
纯粹 地 根据 统计 理论 来 确定 . 例如 , 不 同 的 金融 机 构 (或 投资 者 ) 具有 不 同 的 风险 
容忍 度 . 这 样 , 他 们 即使 对 于 相同 的 金融 头寸 也 可 以 选择 不 同 的 门限 . 对 于 本 章 中 
考虑 的 TBM 股票 的 日 对 数 收益 率 , 计算 的 VaR 对 n 的 选择 是 不 敏感 的 . 

门限 y 的 选择 也 依赖 于 观测 到 的 对 数 收益 率 . 对 一 个 稳定 的 收益 率 序列 , 选择 
n= 一 2.5% 对 多 头头 寸 而 言 是 相当 好 的 . 对 一 个 有 较 大 波动 的 收益 率 序 列 (例如 网 
络 股 的 日 收益 率 ), n 可 能 低 至 — 1095. 有 限 的 经 验 表 明 , 可 以 通过 选择 ， 使 得 超越 
的 次 数 足够 大 (如 大 约 为 样本 总 数 的 5%). 对 于 选择 y 的 一 个 更 加 正式 的 研究 , 可 
以 参见 Danielsson 和 de Vries (1997b). 


7.7.1 ”统计 理论 


青 一 次 考虑 资产 的 对 数 收益 率 r. 假定 第 i 个 超越 在 t 时 刻 发 生 . 集中 讨论 超 
越 量 r — n 和 超越 时 刻 t; 将 导致 统计 想法 的 重要 变化 新 方法 并 不 使 用 边际 分 布 
(如 最 小 值 或 最 大 值 的 极限 分 布 ), 而 是 采用 一 个 条 件 分 布 来 处 理 给 定 观测 超过 一 个 
门限 的 条 件 下 超越 量 的 大 小 . 超过 门限 的 机 会 是 由 概率 规律 控制 的 . 换 句 话说 , 新 
方法 考虑 了 多 头头 十 在 给 定 r < n For = r — 9 的 条 件 分 布 . 事件 (n < n} If 
出 现 服从 一 个 点 过 程 (例如 一 个 泊 松 过 程 ). 对 泊 松 过 程 的 定义 可 参见 6.9 35. 具体 
地 , 如 果 过 程 的 强度 参数 A 随时 间 不 变 , 则 泊 松 过 程 是 齐 次 的 ; 如 果 入 随时 间 变 化 ， 
则 泊 松 过 程 是 非 齐 次 的 . 泊 松 过 程 的 概念 可 以 一 般 化 到 多 元 的 情形 . 

为 了 表示 方便 , 下 面 我 们 利用 一 个 正门 限 以 及 收益 率 分 布 的 右 侧 来 讨论 极 值 理 
论 新 方法 背后 的 统计 理论 . 这 相当 于 持 有 一 个 空头 头寸 . 然而 ， 如 果 将 此 理论 运用 
到 rt 序列, rf = 一 re, 则 该 理论 对 于 一 个 多 头头 寸 适用 得 也 同样 好 . 这 一 点 很 容易 
看 出 , 因为 对 一 个 正门 限 r£ 2 n, 等 价 十 n < 一 n, 这 里 <n 变 为 一 个 负 门 限 . 

新 方法 的 基本 理论 是 对 于 方程 (7.29) 中 给 出 的 最 大 值 的 极限 分 布 考虑 给 定 
"> 下 7 二 十 7 的 条 件 分 布 . 因为 没有 必要 选择 子 区 间 的 长 度 n. 所 以 我 们 
不 用 它 来 表示 一 个 参数 的 下 标 . 给 定 > KER r <a n 的 条 件 分 布 为 
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Pr(n <r<r+n)  Pr(r&z-15)- Pr(r € n) 
Pr(r > 7) 1— Pr(r <n) | 


利用 方程 (7.29) 中 的 累积 分 布 函 数 FL (-) 以 及 近似 e = 1 一 y, 经 过 一 些 代数 运算 
之 后 , 我 们 得 到 


Pr(r € z+nlr >) = (7.31) 


Fig F.(a-4 m) — F.(n) 
^ 1-R(m) 


1/k i 1/k 

p: v Meu | Pes {—[1- Ha] | 
本 
ool fA | 


kr l/k 
r21— [ = eal P (7.32) 


其 中 zx > 0, 且 1- km 一 DB/a 0. 以 后 将 会 看 出 , 这 个 通 近 使 得 新 方法 与 传统 的 
极 值 理论 之 间 的 连接 更 明确 了 .大 = 0 的 情形 可 看 作 是 上 一 0 的 极限 , 从 而 


Pr(r s+ nir >)= 


Pr(r € z 4 n|r >n) + 1 — exp(—7/a). 


称 下 述 累 积分 布 函数 为 广义 帕 累 托 分 布 (GPD), 


ka F 
j h- | ‘#0. 
Gy st (E) = | vn) (7.33) 


1—exp|[-z/v(g), k=0. 


HP yin) > 0, H3 k< 0R, 220; 4 k 501, dde 于 是 ; (7.32) 
式 的 结果 表明 给 定 > > 7? r 的 条 件 分 布 可 以 由 GPD 很 好 地 近似 . 该 GPD HS 
HH k H wm) =a- kin- 8). 更 多 的 信息 可 参见 Embrechts (1997). GPD 的 
一 个 重要 性 质 如 下 . 假定 在 给 定 门限 no 时 7 的 超额 分 布 为 GPD, 且 其 形状 参数 为 
k, 刻度 参数 为 plno), 则 对 任意 的 门限 n > wo, 给 定 门 限 n 的 超额 分 布 也 是 GPD, 
并 且 其 形状 参数 为 k, 刻度 参数 为 Vln) = v(no) — k(n — no). 

当天 二 0 时 , (7.33) 式 的 GPD 退化 为 指数 分 布 . 该 结果 使 得 我 们 可 以 利用 超出 
某 个 门限 的 超额 收益 对 指数 分 布 的 QQ 图 来 推断 收益 率 的 尾部 行为 . 如 果 k = 0, 
则 QQ 图 是 一 条 直线 . 图 7-6a 给 出 了 本 章 所 用 的 IBM 股票 的 负 的 日 对 数 收益 率 的 
QQ 图 , 这 里 门限 为 0.025. 图 像 的 非 线性 清楚 地 表明 了 IBM 对 数 收益 率 的 左 尾 要 
比 指数 分 布 的 厚 , 即 AO. 
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(a) IBM 股票 的 负 日 对 数 收 益 率 


6 
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š 3 
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有 序数 据 
(b) 超额 均值 图 


-9.10 一 0.05 0.0 0.05 0,10 


门限 
图 7-6 从 1962 年 7 月 3 日 到 1998 年 12 月 31 日 的 IBM 股票 的 负 日 对 数 收益 率 的 
图 像 : (a) 门限 为 2.5% 时 超额 收益 率 的 QQ 图 ; (b) 超额 均值 图 


绘制 图 像 7-6 时 所 用 到 的 S-Plus 命令 


> par (mfcol=c(2,1)) 

> qplot (-ibm, threshold=0.025, 

+ main-'Negative daily IBM log returns’) 
> meplot (-ibm) 

> title(main-'Mean excess plot’) 


7.7.2 ”超额 均值 函数 


给 定 一 个 高 的 门限 no 时 , 假定 超额 收益 + 一 wo RASS k A Yl) 的 GPD, 
其 中 0 > k > 一 1. 则 超过 门限 no 的 超额 均值 为 


(rio) 
1 十 大 


E(r — mlr > no) = 


对 于 任意 1 > 0, 定义 超额 均值 函数 e(n) 为 


e(n) = E(r — gir > gj) = AU) — Gi — 19) 
lik 
言 之 , 对 任意 y > 0, 
(no) — ky 
l+k C 


因此 , 对 于 固定 的 人 , 超额 均值 函数 是 y = n — no 的 线性 函数 . 该 结果 引出 了 一 个 简 
单 的 绘图 方法 来 对 GPD 推断 出 一 个 合适 的 门限 值 mo. 定义 经 验 超额 均值 函数 为 


e(o + y) = Er — (no + y)lr > no y] = 


Nn 


er(n) = x- Yr — 9) (7.34) 


i1 
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其 中 N, 是 超出 7 的 收益 率 的 数量 , re 是 相应 的 收益 率 的 值 . 对 于 记号 上 的 更 多 信 
息 参见 下 一 小 节 . er(n) 对 n 的 散 点 图 称 为 超额 均值 图 . n> no 时 , 该 图 关于 7 
是 线性 的 . 图 7-6b 给 出 了 IBM 股票 的 负 日 对 数 收益 率 的 超额 均值 图 . 该 图 表明 ， 
与 其 他 值 相 比 而 言 , 门限 值 取 3 又 对 负 的 日 对 数 收益 率 是 合理 的 . 在 S-Plus 中 绘制 
超额 均值 图 的 命令 是 meplot. 


7.7.3” 极 值 建 模 的 一 个 新 方法 


利用 方程 (7.32) 的 统计 结果 , 并 且 联 合 考 虑 超越 量 与 超出 时 间 , Smith (1989) 
提出 了 一 个 二 维 泊 松 过 程 来 对 (ti,w,) 建 模 . Tsay (1999) 利用 这 个 方法 来 研究 风险 
管理 中 的 VaR. 本 节 我 们 利用 同样 的 方法 . 

假定 基本 的 时 间 间 隔 为 D, 其 典型 的 取 法 是 1 年 . 在 美国 , 因为 1 年 中 一 般 有 
252 个 的 交易 日 , 所 以 使 用 D = 252. > t 表示 数据 点 的 时 间 间 隔 (例如 日 ), 并 将 时 
间 区 间 表 示 为 上 = 1,2,… ,了 T, 其 中 T 代表 全 部 数据 点 的 个 数 . 对 个 给 定 的 门限 
5, 超出 门限 的 超额 时 间 用 {tii = 1,… ,Nw} 来 表示 , TE ti 点 观测 到 的 对 数 收 益 率 
为 m .因此 , 我 们 集中 讨论 对 {(ti re}, i= Lo Ny 建 模 , 这 里 NS 依赖 于 门限 
n. 

运用 极 值 理论 的 新 方法 是 猜想 超越 时 间 与 相关 收益 率 [ 即 (tirn) 联合 形成 了 
一 个 二 维 的 泊 松 过 程 , 其 强度 测度 由 下 式 给 出 


D» 


Al(D2, Di) x (neoj = 5577 8(r5k, a B), (7.35) 


(n — BYE 
其 中 S(rik a, 8) = i- ae A) z 2 QO«D,«Da&T,r»7,o0»0,8 4 k BS 
C + 


数 . 记号 四 + 定义 为 [x], = max(z, 0). 这 个 强度 测度 说 明 , 超越 门限 的 出 现 与 时 间 
BE [Di, Do] 的 长 度 成 正比 , 并 且 此 概率 可 以 由 类 似 于 方程 (7.29) 中 累积 分 布 函数 
(7) 的 生存 函数 的 指数 来 控制 . 随机 变量 X 的 生存 函数 定义 为 S(x) = Pr(X > 
g) =1—Pr(X < z) = 1 —cdf(z). 

“4 Kk — 0 时 , 强度 测度 可 看 作 上 天 一 0 的 极限 , BI 


Al(D2, D1) x (r,00)] = 227 exp . 


Cx 


Jj à (7.35) 中 , 时 间 间 隔 的 长 度 是 相对 于 基本 区 间 长 度 D 来 度量 的 . 
在 考虑 时 间 段 (0, D] 上 , 给 定 7 >n RAFF, r= x+ nla 0) 的 隐 含 条 件 概 率 
时 , 利用 方程 (7.35) 中 的 强度 测度 的 思想 将 变 得 非常 清楚 . 


A[(0,D) x (x +7, 00)] _ [teen Ble)” -| 7 ka n 
A[(0,D)x(moo] | 1-—k(y— 8)/a a — k(n — 8) 
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i ie 
恰 是 方程 (7.32) 中 给 出 的 条 件 分 布 的 精确 生存 函数 . 这 个 生存 函数 是 从 由 方程 
(7.29) 给 出 的 最 大 值 的 极限 极 值 分 布 得 到 的 . 这 里 我 们 利用 了 生存 函数 , 因为 它 代 
表 了 超越 所 发 生 的 概率 . 

方程 (7.29) 中 的 极限 极 值 分 布 与 方程 (7.35) 中 的 强度 测度 的 关系 直接 将 极 值 
理论 的 新 方法 与 传统 方法 连接 了 起 来 . 
数学 上 , 方程 (7.35) 的 强度 测度 可 以 写 为 一 个 强度 函数 的 积分 


Da poo 
ANDADOR 003] = | | A(t, 23k, ar, B)dtdz, 

Dy Jr 

其 中 强度 函数 A(t, z; ko, 8) 定义 为 
Xt, zia) = D9(z; kya, B), (7.36) 
其 中 
1/k—1 
È | - B) , ko, 


g(z;k, a, p) = 
~ exp rx i A k=0. 

利用 泊 松 过 程 的 结果 , 我 们 可 以 写 下 观测 到 的 超越 时 间 与 相应 收益 率 {(ti, re, )} 
在 二 维 空间 [0, N] x (n, oc) 上 的 似 然 函数 为 


Ny 


L(k, o, 8) = (i 9(reih Oy ») * exp |-55« k, cx, 8) . (7.37) 


i=1 


BB k, cx, p 可 以 通过 最 大 化 这 个 似 然 函数 的 对 数 来 估计 . 因为 尺度 参数 a 是 负 的 ， 
所 以 在 估计 中 我 们 利用 了 In(a). 

Bi 7.7 再 次 考虑 IBM 股票 从 1962 4E 7 H 3 AS 1998 4F 12 H 31 日 的 日 对 数 收 
mE, 共有 9 190 个 日 收益 率 的 值 . 表 7-3 给 出 了 负 序 列 (7n) 在 门限 的 三 种 选择 
下 参数 ko, 的 一 些 估计 结果 . 我 们 利用 了 负 序 列 {r}, 而 不 是 (rid, 这 是 因为 
我 们 集中 于 讨论 持 有 一 个 多 头 的 金融 头寸 . 此 表 也 给 出 了 给 定 门限 下 的 超越 次 数 . 
可 以 看 出 TBM 股票 在 1 天 中 降低 2.5% 或 者 更 多 的 机 会 出 现 的 概率 为 310/9 190 约 
为 3.496. 因为 IBM 股票 收益 率 的 样本 均值 不 是 0, 所 以 我 们 也 考虑 了 当 样 本 均值 
从 原始 的 对 数 收益 率 中 去 除 以 后 的 情况 . 从 表 中 看 出 ， 去 除 样 本 均值 后 对 参数 估计 
只 有 很 小 的 影响 . 下 面 利 用 这 些 参数 估计 来 计算 VaR. 注意 在 实际 应 用 中 必须 要 仔 
细 检 查 拟 合 一 个 泊 松 模型 的 充分 性 . 下 面 我 们 将 讨论 模型 检验 的 方法 . 
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表 7-3 对 IBM 股票 从 1962 年 7 月 3 日 到 1998 年 12 月 31 日 的 
负 日 对 数 收 益 率 的 二 维 齐 次 泊 松 模型 的 估计 结果 ? 


Thr. Exc. 形状 参数 k 对 数 CRURE)in (a) 位 置 a 
原始 的 对 数 收益 
3.0% 175 —0.306 97(0.090 15) 0.306 99(0.123 80) 4.692 04(0.190 58) 
2.596 310 —0.264 18(0.065 01) 0.315 29(0.112 77) 4.740 62(0.180 41) 
2.0% 554 —0.187 51(0.043 94) 0.276 55(0.098 67) 4.810 03(0.172 09) 
移 除 样本 均值 
3.0% 184 —0.305 16(0.088 24) 0.308 07(0.123 95) 4.738 04(0.191 51) 
2.596 334 —0.281 79(0.067 37) 0.319 68(0.120 65) 4.768 08(0.185 33) 
2.0% 590 一 0.192 80(0.043 57) 0.279 17(0.099 13) 4.848 59(0.172 55) 


see 
a 基本 的 时 间 间 隔 为 252 X ( 即 一 年 )， 插 号 内 的 数 为 标准 误差 ， 其 中 “Thr.” 和 “Exc” Rast] PR 
(threshold) 和 超越 次 数 (number of exceedings). 


7.7.4 ”基于 新 方法 的 VaR 计算 


正如 方程 (7.32) 显示 的 , 运用 的 二 维 泊 松 过 程 模型 ( 它 采 用 了 方程 (7.35) 中 的 
强度 测度 ) 与 方程 (7.29) 中 的 极 值 分 布 具 有 同样 的 参数 值 . 因此 , 可 以 利用 与 方程 
(7.30) 同样 的 公式 计算 新 方法 下 的 VaR. 更 具体 地 , 对 一 个 给 定 的 上 尾 概率 p, 对 数 
收益 率 nV 的 (1 一 p) 一 分 位 数 为 


{ B+<{1—[-Din(l—p)|*}, Ak #0, 
VaR = l 


(7.38) 
3+ aln[- D In(1 — p)], T k=0, 


其 中 p 为 估计 中 使 用 的 基本 时 间 间 隔 . 典型 地 , 美国 利用 D = 252 表示 1 年 中 交 
易 日 的 近似 数量 . 
例 7.8 再 次 考虑 持 有 一 个 价值 1 千 万 美元 的 IBM 股票 的 多 头头 寸 的 情形 . 我 们 
利用 表 7-3 中 的 估计 结果 对 尾 概率 为 0.05 和 0.01 计算 持 有 期 为 1 天 的 VaR. 
情形 1 利用 原始 的 日 对 数 收益 率 . 门限 7 的 三 种 选择 导致 了 下 面 的 VaR f&: 
(1) n = 3.0%: VaR(5%)=$228 239, VaR(1%)=$359 303; 
(2) n= 2.5%: VaR(5%)=$219 106, VaR(176)—$361 119; 
(3) 7 = 2.0%: VaR(5%)=$212 981, VaR(1%)=$368 552; 
情形 2 消除 日 对 数 收益 率 的 样本 均值 . 门限 STE SAS PA VaR 


(1) n = 3.096: VaR(5%)=$232 094, VaR(1%)=$363 697; 

(2) n = 2.5%: VaR(596)—$225 782, VaR(1%)=$364 254; 

(3) n = 2.0%: VaR(5%)=$217 740, VaR(1%)=$372 372. 
正如 料想 的 , 消除 样本 均值 ( 正 值 ) 将 使 VaR 稍微 有 所 增加 ， 然而, VaR 在 门限 的 
三 种 选择 下 相当 稳定 . 实际 中 , 我 们 建议 将 新 方法 运用 到 VaR 计算 中 之 前 首先 消 
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除 样本 均值 . 
讨论 与 例 7.6 中 的 VaR 相 比 (那里 使 用 了 传统 的 极 值 理论 ), 新 方法 提供 了 一 个 
更 加 稳定 的 VaR 计算 . 传统 方法 对 于 子 区 间 长 度 n 的 选择 是 相当 敏感 的 . 


7.7.5 ”参数 化 的 其 他 方法 


如 同 前 面 提 到 的 那样 , 对 于 给 定 的 门限 n, GPD 也 可 以 通过 形状 参数 上 和 刻度 
参数 s(n) = a 一 k(n — 8) 进行 参数 化 . 这 下 是 S-Plus 中 所 用 到 的 参数 化 . 事实 上 ， 
S-Plus "PAY (xi, beta) 对 应 于 本 章 的 (—k,u)(n)). 在 S-Plus 中 估计 GPD 模型 的 
命令 是 gpd. 为 了 说 明 , 考虑 从 1962 年 到 1998 年 的 IBM 股票 的 负 日 对 数 收 益 率 . 
结果 如 下 : 

»nibm.gpd-gpd(-ibm,threshold-0.025) 

»names (nibm.gpd) 


[1] *n" "data" 

[3] "upper.exceed" "lower.exceed" 

[5] "upper.thresh" "lower.thresh" 

[7] "p.less.upper.thresh"  "p.larger.lower.thresh" 

[9] "n.upper.exceed" "n.lower.exceed" 
[11] "upper.method" "lower.method" 
[13] "upper.par.ests" "lower.par.ests" 
[15] "upper.par.ses" "lower.par.ests" 
[17] "upper.varcov" "lower.varcov" 
[19] "upper.info" "lower.info" 

[21] "upper.converged" "lower.converged" 
[23] "upper.nilh.final" "lower.nllh.final" 
>nibm. gpd$upper . thresh 

[1] 0.025 


»nibm.gpd$n.upper.exceed % number of exceedances 
[1] 310 
2nibm.gpd$p.less.upper.thresh % i-prob (exceedance) 
[1] 0.9662677 
>nibm.gpd$upper. par.ests 
xi beta 
0.2641418 0.00778777 
»nibm.gpd$upper.par.ses 
xi beta 
0.06659759 0.0006715558 
>par (mfcol=c(2,2)) 
>plot (nibm. gpd) 
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Make a plot selection (or 0 to exit): 

1: plot: Excess Distribution 

2: plot: Tail of Underlying Distribution 

3: plot: Scatterplot of Residuals 

4: plot: QQplot of Residuals 

Selection: 

注意 到 结果 与 表 7-3 中 的 结果 非常 靠近 . 表 7-3 中 用 的 是 对 数 收益 率 的 百分比 . 
在 表 7-3 "P. k 和 yin) 的 估计 分 别 是 —0.264 18 和 a — k(n — 8) = exp(0.3152 9) 一 
(—0.264 18)(2.5 — 4.740 6) = 0.778 73. 对 于 对 数 收益 率 , Y(n) 的 估计 是 0.007 787. 
这 与 S-Plus 的 估计 结果 一 样 . 

图 7-7 显示 了 给 IBM 股票 的 负 日 对 数 收益 率 拟 合 GPD 的 诊断 检验 图 . QQ 图 
( 右 下 角 ) 和 尾 概率 估计 (左下 角 , 并 取 对 数 刻度 ) 显示 出 与 直线 有 微小 的 偏差 . 这 
表明 可 能 需要 进一步 的 改进 . 
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图 77 给 IBM 股票 拟 合 从 1962 年 7 月 3 日 到 1998 年 12 月 31 日 的 负 日 对 数 收益 率 
GPD 的 诊断 检验 图 


对 于 (7.31) 式 、(7.32) 式 以 及 (7.33) 式 的 GPD 的 条 件 分 布 , 我 们 有 


F(y)—F 
Mn = Grin) c), 


Ep y—ax+n,c> 0. 如 果 我 们 通过 经 验 cdf 来 估计 收益 率 的 累积 分 布 函 数 F'(1]), 
则 


F(n) = lem 
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其 中 N, 是 超越 门限 n 的 次 数 , T 是 样本 容量 . 因此 


Fly)=F(n) + G(z)1 — F(n)] 
Nn [ id € 


~1—— 


T 


这 就 引出 了 VaR 计算 中 所 用 到 的 F(y) 的 分 位 数 的 另 一 种 估计 . 特别 地 , 对 于 上 尾 
概率 p, HA 0 < p< 0.05, 4 q=1—p, W Fly) 的 9 分 位 数 VaR, 可 以 由 下 式 估 计 


^ k 
van =n t fi- [Sao] h (7.39) 


其 中 , 如 前 面 一 样 7 是 门限 , T 是 样本 容量 , N, 是 超越 门限 的 次 数 , GPD 的 刻度 参 
数 和 形状 参数 分 别 为 (n) 和 上 大. 在 S-plus 中 正 是 用 此 种 方法 计算 VaR 的 . 

与 VaR 有 关 的 另外 一 个 经 常用 的 风险 度量 是 期 望 不 足 (expected shortfall, ES). 
它 定义 为 超过 VaR 后 的 期 望 损失 . 特别 地 , 对 于 给 定 概 率 g( 具 体 地 , 0.95 < q < 1), 
期 望 不 足 定义 为 


ES, = E(r|r > VaR4) = VaR, + E(r — VaRy|r > VaRy). (7.40) 
利用 GPD 的 性 质 , 可 以 证 明 


E(r — VaR,|r > VaR,) = Pi) — ROPA — 2) 


上 式 中 0>k > —1. 因此 , 我 们 有 


VaR, w(n) — kn 
S; = EE 
ake aaa ee 


为 了 说 明 计 算 VaR Al ES 的 新 方法 , 我 们 仍然 应 用 IBM 股票 的 负 日 对 数 收益 
率 , 且 其 门限 为 2.5%. S-Plus 命令 为 


riskmeasures: 


> riskmeasures (nibm.gpd, c(0.95,0.99)) 
P quantile sfall 

[1,] 0.95 0.02208833 0.03162723 

[2,] 0.99 0.03616619 0.05075763 


从 输出 结果 来 看 , 对 于 尾 概率 0.05 和 0.01, 金融 头寸 的 VaR 值 分 别 为 $220 889 
和 $361 661. 这 两 个 值 与 例 7.8 给 出 的 值 非常 靠近 . 例 7.8 的 结果 基于 前 一 小 节 所 
给 出 的 方法 得 到 ， 对 于 尾 概 率 0.05 和 0.01, 金融 头寸 的 ES 分 别 是 $316 272 和 
$507 576. 
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7.7.6 ”解释 变量 的 使 用 


前 面 讨论 的 二 维 泊 松 模型 是 齐 次 的 , 因为 三 个 参数 , a 和 8 随时 间 不 变 . 实 
际 中 , 这 种 模型 可 能 并 不 充分 . 此 外 , 通常 要 利用 一 些 能 够 影响 对 数 收益 率 ny 的 解 
释 变 量 . 新 的 极 值 理 论 方法 对 VaR 计算 的 一 个 好 的 特性 是 它 能 很 容易 地 将 解释 变 
量 考虑 进来 . 本 小 节 将 讨论 这 样 一 个 考虑 解释 变量 的 框架 ， 另 外 , 我 们 也 讨论 可 以 
用 来 检验 所 拟 合 的 二 元 泊 松 模型 充分 性 的 方法 . 

假定 £i = (muss muy 是 vw 个 解释 变量 的 向 量 , 在 时 刻 t 以 前 就 可 以 得 到 . 
对 资产 收益 率 , 第 3 章 讨论 的 ni 的 波动 率 o? 是 一 个 解释 变量 的 例子 . 美国 让 券 
市 场 上 解释 变量 的 另 一 个 例子 是 表示 联邦 公开 市 场 委 员 会 (Federal Open Market 
Committee) 会 议 的 示 性 变量 . 利用 解释 变量 的 一 个 简单 方法 是 猜想 三 个 参数 k, a 
和 3 是 时 变 的 , 而 且 是 解释 变量 的 线性 函数 . 具体 地 , 当 解 释 变 量 a, 可 以 得 到 时 ， 
我 们 假定 

kit = Jot N21 d- 7 + yorvt = YY Tt, 
In(o4) = do + SiTi t -+ utu = fo + £u, (7.41) 
B, = 0o + 04114 + + Opry, = 09 + O'T. 
MR 7 = 0, 则 形状 参数 ki = 70, 且 它 是 随时 间 不 变 的 . 这 样 , 检验 7 的 显著 性 可 
以 提供 关于 解释 变量 对 形状 参数 的 贡献 的 信息 . 类 似 的 方法 可 以 运用 到 尺度 参数 和 
位 置 参 数 中 . 在 方程 (7.41) 中 , 我 们 对 所 有 的 三 个 参数 ki, Inla) 和 PB 都 使 用 了 同 
样 的 解释 变量 . 在 应 用 时 , 不 同 的 参数 可 以 使 用 不 同 的 解释 变量 . 
当 极 值 理论 的 三 个 参数 是 时 变 的 时 候 , 我 们 得 到 一 个 非 齐 次 的 泊 松 过 程 . 强度 
测度 变 为 
ki 
A[(Ds, Da) x (r,00)} = TA (1 E Be) aT (7.42) 
Ot a 


超出 时 间 点 和 收益 率 { (ti, re.) } 的 似 然 郴 数 变 为 


Ny T 
L 1 
= (i E) X exp -5 i S(n; kon a i 


如 果 假 定 参数 ki a 和 有 在 每 个 交易 日 内 是 固定 的 , 其 中 glz; ke, at, Be) 和 Sm; ke, 
ct, Br) 分 别 由 方程 (7.36) 和 (7.35) 给 出 , 则 似 然 函 数 简化 为 


Ny, - 
L= (ü Bras Ke, , Otia Be, ) x exp -3 2; S(r ke, ae, so) - (7.43) 


对 给 定 的 观测 值 {ret = 1, Th 且 基本 的 时 间 间 隔 为 D, 门限 为 n 方程 
(7.41) 的 参数 可 以 通过 最 大 化 方程 (7.43) 的 对 数 似 然 函数 来 估计 . 这 里 再 一 次 使 用 
了 ln(o*) 来 满足 o, 为 正 的 限制 . 
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注释 : ” 从 三 个 参数 都 是 时 齐 + 时 可 以 得 到 信息 的 精确 函数 这 个 意义 上 讲 , 方 
程 (7.41) 的 参数 化 类 似 于 第 3 章 中 波动 率 模型 的 参数 化 如果 有 必要 也 可 以 使 用 
其 他 函数 . 口 


7.7.7 ”模型 检验 


对 超越 次 数 和 超出 量 检验 的 二 维 泊 松 过 程 模型 进行 检验 涉及 检验 模型 的 三 个 
重要 性 质 . 第 一 个 性 质证 明 超越 率 的 充分 性 ; 第 二 个 性 质 检验 超越 的 分 布 ; 最 后 一 
个 性 质 检 验 模型 的 独立 性 假设 . 我 们 主要 讨论 在 检验 这 三 个 性 质 时 有 用 的 一 些 统 
计量 . 这 些 统计 量 基于 一 些 基 本 的 、 与 分 布 和 随机 过 程 相关 的 统计 理论 . 


超越 率 


一 维 泊 松 过 程 的 一 个 基本 性 质 是 接连 的 两 个 事件 之 间 的 时 间 持 续 期 是 独立 的 
且 都 服从 指数 分 布 . 为 了 采用 检验 一 个 二 维 过 程 模型 的 类 似 性 质 , Smith 和 Shively 
(1995) 提出 了 研究 接连 的 两 个 超越 间 的 时 间 持 续 期 . 如 果 这 个 二 维 的 泊 松 过 程 模型 
对 超越 次 数 和 超越 量 是 恰当 的 , 则 第 i 个 超越 与 第 i 一 1 个 超越 之 间 的 时 间 持 续 期 
应 该 服从 一 个 指数 分 布 . 更 具体 地 , 令 to = 0, 我 们 期 望 


ty 1 
Sti =| —g(m ks, Qs Bs)ds, i=1,2, 
ti D 


是 独立 同 分 布 (ii.d.) 的 , 且 均 服从 一 个 标准 指数 分 布 . 因为 日 收益 率 是 离散 时 间 的 
观测 值 , 我 们 采用 的 时 间 持 续 期 为 


i= UK S(m ke, at, Be), (7.44) 
ttita 
并 利用 分 位 数 -分 位 数 (QQ) 图 来 检验 独立 同 分 布 标准 指数 分 布 的 有 效 性 . 如 果 模 
型 是 充分 的 , 则 QQ 图 应 显示 一 条 通过 原点 且 斜 率 为 1 的 直线 . 


超越 量 的 分 布 


在 所 考虑 的 二 维 泊 松 过 程 模型 下 , 超过 门限 ”的 超越 量 n, = r-n 的 条 件 分 布 
是 一 个 形状 参数 为 k, 尺度 参数 为 办 = ar — kiln — Be) 的 广义 帕 累 托 分 布 (GPD). 
因此 , 我 们 可 以 利用 标准 指数 分 布 与 GPD 之 间 的 关系 , 定义 
—1 Pi 
—In 圭一 k,——— Tk, #0, 
Üg = ie ( Pti ) (7.45) 
E X 若 ki, — 0. 


如 果 模 型 是 充分 的 , 则 {wi,} 是 独立 的 且 服 从 均值 为 1 的 指数 分 布 . 可 参见 Smith 
(1999). 我 们 可 以 利用 QQ 图 来 对 检验 超出 量 GPD 假定 的 有 效 性 . 
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独立 性 
在 调整 解释 变量 的 影响 以 后 , 检验 独立 性 假定 的 一 个 简单 方法 是 研究 >， 与 


we, 的 样本 自 相 关 函 数 . 在 独立 性 假定 下 , 我 们 期 望 ,和 us, 的 序列 相关 系数 都 是 
*. 


7.7.8 ”说明 


在 本 小 节 中 , 我 们 对 IBM 股票 从 1962 42 7 H 3 A 1998 4E 12 A 31 日 以 百 
分 比 表 示 的 日 对 数 收益 率 采 用 了 一 个 二 维 非 齐 次 的 泊 松 过 程 模型 ， 我 们 集中 于 讨 
论 持 有 一 个 1 千 万 美元 的 多 头头 寸 . 该 分 析 使 我 们 能 够 与 前 面 利 用 其 他 方法 计算 
VaR. 所 得 到 的 结果 相 比 较 . 

首先 我 们 指出 例 7.7 中 的 二 维 齐 次 模型 需要 进一步 提炼 . 因为 拟 合 的 模型 没 能 
通过 7.7.7 节 中 的 模型 统计 量 的 检验 . 图 7-8a 与 图 7-8b 显示 了 齐 次 模型 当 门 限 为 
n= 2.596 时 , x, 和 us, 的 自 相 关 函 数 , 其 定义 分 别 见 (7.44) 5 (7.45). 图 形 中 的 两 
个 水 平 线 表示 两 个 标准 误差 的 浙 近 上 下 限 . 可 以 看 出 和 us, 序列 都 有 某 些 显 著 
的 序列 相关 性 . 图 7-9a 与 图 7.9b 显示 了 =, 和 uw, 序列 的 QQ El, 每 个 图 形 中 的 
直线 都 为 理论 线 , 它 过 原点 并 且 在 标准 指数 分 布 假定 下 斜率 为 1，z, 的 QQ AE 


(a) FK: z (c) 非 齐 次 : z 
0.4 0.4 
0.2 0.2 
A 
Cc 00 O 0.0 
= 
—0.4 —).4 
l2 3 4 & 8 T & 9 BH LA 9 4 & E * 8 9 30 
间隔 间隔 
(b) FX: w (d) 非 齐 次 : w 
0.4 04 
0.2 0.2 
& 0.0 S 00 
1 
—().4 0.4 
l2 $.« $6 E T R 5 1) 12 8 45565 7T 8 5 19 
fa] Bà 问 隔 


图 7-8 二 维 非 齐 次 泊 松 过 程 模型 中 的 z 和 w 序列 的 样本 自 相关 函数 . (a) 与 (b) 显示 对 齐 次 
模型 的 结果 ; (c) 与 (d) 显示 对 非 齐 次 模型 的 结果 . 所 用 数据 为 [BM 股票 从 1962 年 7 
月 3 日 至 1998 年 12 月 31 日 以 百分比 表示 的 , 经 均值 修正 后 的 日 对 数 收益 率 , 门限 
Ain = 2.5%. 所 使 用 的 是 多 头 金融 头寸 
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(a) FFU: 2 (c) 非 齐 次 : > 

1 6 

10 1 

8 s 
9 s 2 
D 0 
0 l 2 $ ud ) 6 Ü 1 2 $ 4 5 6 
exp exp 

(b) Jr: w (d) 非 齐 次 : w 


hw 
wm e O c 


ihw 


Ü 4 2 3 4 5 6 


exp exp 
图 7-9 “二 维 非 齐 次 泊 松 过 程 模型 中 的 > 和 w 序列 的 QQ Bl. (a) 5 (b) 显示 对 齐 次 模 
型 的 结果 ; (c) 与 (d) 显示 对 非 齐 次 模型 的 结果 . 所 用 数据 为 IBM 股票 从 1962 
年 7 月 3 日 至 1998 年 12 月 31 日 以 百分比 表示 的 、 经 均值 修正 后 的 日 对 数 收 
益 率 , 门限 为 n — 2.5%. 所 使 用 的 是 多 头 金融 头寸 


示 了 某 些 不 相符 性 , 
为 了 提炼 模型 , 我 们 使 用 均值 修正 的 对 数 收益 率 序 列 


1 9190 
Dm? —rn f, a TO 
à t= 


其 中 r, 为 百分比 表示 的 日 对 数 收益 率 , 并 日 采用 下 而 的 解释 变量 . 

(1) zi: 对 10 A. 11 月 和 12 月 的 示 性 变量 . 即 , 如 果 t 在 10 月 、11 月 或 12 
月 , WW ay, = 1. 选择 这 个 变量 是 考虑 到 四 个 季度 对 IBM 日 对 数 收益 率 的 影响 (或 
称 年 末 效 应 )( 如 果 这 种 影响 效应 存在 的 话 ). 

(2) sa: 对 前 一 个 交易 日 行为 的 示 性 变量 . 具体 地 , co, — 1 当 且 仅 当 对 数 收益 
率 r? < —2.5%. 因为 我 们 集中 于 讨论 门限 为 2.5% 的 一 个 多 头头 寸 , 当 价 格 降 低 
超过 2.5% 时 超越 发 生 . 因此 , 当 IBM 股票 的 价格 相对 于 前 一 天 交易 日 的 价格 降低 
2.5% 或 更 多 时 , 使 用 zat KA 28 Dc En] RT RETE. 

(3) zat: 波动 率 的 一 个 定性 测度 , CE £—1 tag t— 1410 t— 5) ZH 
具有 超过 门限 的 对 数 收 益 率 的 天 数 . 在 所 考虑 的 情形 下 , za 是 满足 |r?_ ,| > 2.5%, 
i=1,::-,5 BY ro, 的 个 数 . 

(4) za: 年 趋势 , 定义 为 zx4 = (时 刻 所 在 的 年 份 一 1961)/38. 用 此 变量 来 识别 
IBM 股票 极 值 收 益 率 行为 中 的 任何 趋势 . 


Tts 
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(5) zs: 基于 对 均值 修正 序列 7? 的 高 斯 GARCH(1,1) 模型 的 波动 率 序列 . H 
体 地 , zst = or, 这 里 0? 为 GARCH(1,1) 模型 


r? = Qt at 一 CrfEt， Et ^? N (0, 1), 


a; = 0.045 65 + 0.080 7a2 , + 0.903 162 ，， 


的 条 件 方差 . 
这 5 个 解释 变量 在 时 刻 1 一 1 都 可 以 得 到 . 我 们 利用 两 个 波动 率 测度 (za 与 mu) 来 
研究 市 场 波动 率 对 VaR 的 影响 . 正如 例 7.3 中 拟 合 的 AR(2)-GARCH(1,1) 模型 所 
WASHI, re 中 的 序列 相关 性 很 弱 , 以 至 于 我 们 不 能 对 均值 方程 接受 任何 ARMA 模 
型 . 

利用 前 面 的 5 个 解释 变量 , 并 日 消除 不 显著 的 参数 , 我 们 得 到 表 7-4 显示 的 佑 
WAR. 图 7-8c 和 d 以 及 图 7-9c 和 d. 显示 了 当 门 限 是 7 = 2.5% 时 拟 合 的 二 维 非 
齐 次 泊 松 过 程 模型 的 模型 检验 统计 量 . zu 与 us, 的 所 有 自 相关 函数 都 在 两 个 标准 
误差 的 渐 近 上 下 限 之 内 . QQ 图 也 显示 了 显著 的 改善 , 尽管 它们 表明 没有 模型 的 充 
分 性 . 根据 检验 结果 , 非 齐 次 模型 看 上 去 是 充分 的 . 


表 7-4 对 IBM 股票 从 1962 年 7 月 3 日 到 1998 年 12 月 31 日 以 百分比 表示 的 
日 对 数 收益 的 二 维 非 齐 次 泊 松 过 程 模型 的 估计 结果 = 


参数 常数 sar 的 系数 zat 的 系数 ast 的 系数 
门限 2.595, dir 334 个 超越 
By 0.320 2 1.477 2 2.199 1 
(标准 误差 ) (0.338 7) (0.322 2) (0.245 0) 
In(ay) —0.811 9 0.330 5 1.032 4 
(标准 误差 ) (0.179 8) (0.082 6) (0.261 9) 
ki 一 0.180 5 —0.211 & —0.355 1 0.260 2 
(标准 误差 ) (0.129 0) (0.058 0) (0.150 3) (0.046 1) 
门限 3.0%, 带 184 个 超越 
Bi 1.156 9 2.191 8 
(标准 误差 ) (0.408 2) (0.290 9) 
In(az) —0.031 6 0.333 6 
(标准 误差 ) (0.120 1) (0.086 1) 
ki 一 0.600 8 —0.248 0 0.317 5 
(标准 误差 ) (0.145 4) (0.073 1) (0.068 5) 
a 利用 了 文中 定义 的 四 个 解释 变量 .此 模型 是 为 持 有 BM 股票 的 多 头头 寸 设 定 的 ， 消 除了 对 数 收益 率 
数据 的 样本 均值 . 


考虑 门限 为 2.5% 的 情形 . 估计 结果 说 明 如 下 几 点 . 

(1) 强度 函数 的 所 有 3 个 参数 都 显著 依赖 于 年 时 间 趋 势 . 特别 地 , 形状 参数 有 
一 个 负 的 年 趋势 , 表明 随时 间 的 变化 , IBM 股票 的 日 对 数 收益 率 偏离 正 坊 性 越 来 越 
远 . 位 置 参 数 和 尺度 参数 都 随时 间 增 大 . 
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(2) 第 4 个 季度 的 示 性 变量 zt 与 恐慌 抛售 的 示 性 变量 zw 对 所 有 的 3 个 参数 
都 是 不 显著 的 . 

(3) 受 GARCH(1,1) 模型 的 波动 率 影响 的 位 置 参数 和 形状 参数 是 正 的 ( 见 rr 
的 系数 ). 这 是 可 以 理解 的 , 因为 当 波 动 率 高 时 , 对 数 收益 率 的 可 变性 增加 了 , 从 而 
降低 了 对 数 收益 率 对 尾 指数 的 依赖 性 . 

(4) 尺度 参数 和 形状 参数 显著 依赖 于 波动 率 的 定性 度量 . 估计 的 符号 也 似乎 是 
合理 的 . 

1998 年 12 月 31 日 的 解释 变量 假定 为 13.9190 = 0, va,g190 = 0.973 7, xz5,9 190 一 
1.976 6. 利用 这 些 值 以 及 表 74 中 拟 合 的 模型 , 假定 尾 概率 为 0.05, 我 们 得 到 


kg 190 = —0.011 95, In(@9190) = 0.193 31, — 39199 = 6.105. 


方程 (7.38) 显示 的 VaR 分 位 数 给 出 VaR — 3.037 56%. 因此 , 对 一 个 1 千 万 美元 的 
多 头头 寸 , 我 们 有 


VaR = 10 000 000 x 0.030 375 6 美元 = 303 756 美元 . 


如 果 尾 概率 是 0.01, 则 VaR 为 497 425 3450. 5% 的 VaR 稍 高 于 例 7.3 中 利用 
AR(2)-GARCH(1, 1) 模型 给 出 的 结果 . 19503 VaR 远 远 高 于 例 7.3 情形 1 的 结果 . 
如 我 们 所 料 , 极 值 ( 即 厚 尾 ) 对 VaR 的 影响 当 使 用 的 尾 概 率 较 小 时 更 加 重要 . 

采用 解释 变量 的 一 个 优势 是 参数 适应 市 场 条 件 的 变化 . 例如 , 对 1998 年 12 月 
30 日 的 解释 变量 假定 的 值 为 13,9189 = 1, za.9189 = 0.973 7, T5.9189 = 1.875 T. 在 这 
种 情形 , 我 们 有 


ko 189 一 —().250 0, In(ag 189) = 0.523 85, Bo 189 = 5.883 4. 
WW 9596 分 位 数 ( 即 尾 概率 为 5%) 变 为 2.691 39% . 因此 , VaR 变 为 
VaR = 10 000 000 x 0.026 913 9 美元 = 269 139 美元 . 


如 果 尾 概率 为 0.01, 则 VaR 变 为 448 323 美元 . 根据 这 个 例子 , 例 7.8 中 显示 的 齐 
次 泊 松 模型 似乎 低估 了 VaR. 


练 习 题 


7.1 考虑 GE 股票 从 1962 年 7 月 3 日 至 1999 年 12 月 31 日 的 日 对 数 收益 率 . 此 数据 可 以 从 
CRSP 或 者 文件 d-ge6299 txt 中 得 到 . 假定 你 持 有 这 只 股票 价值 100 万 美元 的 多 头头 
寸 . 采用 尾 概率 0.05, 并 利用 下 面 的 方法 计算 1 天 持 有 期 和 15 天 持 有 期 的 风险 值 (VaR). 
(a) 风险 度量 制 方法 . 
(b) 高 斯 ARMA-GARCH 模型 . 
(c) 带 学 生 t- 分 布 的 ARMA-GARCH 模型 , 这 时 你 也 需要 估计 自由 度 . 
(d) FRMKREA n = 21 的 传统 极 值 理论 ， 
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7.2 文件 d.csco9199.txt 含有 Cisco 系统 股票 从 1991 年 到 1999 年 的 日 对 数 收益 率 , 共 


2 275 个 观测 值 . 假定 你 持 有 Cisco 系统 股票 的 一 个 价值 100 万 美元 的 多 头头 寸 , 利用 概 

率 p = 0.01, 计算 你 的 头 才 在 下 一 个 交易 日 的 风险 值 . 

(a) 利用 风险 度量 制 方法 

(b) 利用 带 条 件 高 斯 分 布 的 一 个 GARCH 模型 

(c) 利用 带 学 生 t- 分 布 的 GARCH 模型 , 你 也 可 能 要 估计 自由 度 ， 

(d) 利用 无 条 件 样本 分 位 数 . 

(e) 利用 一 个 门限 为 2% 的 二 维 齐 次 泊 松 过 程 ， 也 就 是 说 , 讨论 股票 日 价格 降低 20699 E 
多 的 超越 次 数 和 超越 量 . 检验 拟 合 的 模型 . 

(f) 利用 一 个 门限 为 2% 的 二 维 非 齐 次 泊 松 过 程 ， 解释 变 量 为 四 年 时 间 趋 势 ; @ 对 10 
月 . 11 月 和 12 月 的 哑 变 量 : @ 基于 一 个 高 斯 GARCH(1,1) 模型 拟 合 的 波动 率 . 对 
拟 合 的 模型 进行 诊断 检验 . 

(g) 利用 门限 2.5%% 和 3% 重复 前 面 的 二 维 非 齐 次 泊 松 过 程 . 评论 门限 的 选择 . 


7.3 对 Cisco 系统 的 日 股票 收益 率 利 用 Hill 估计 以 及 数据 d-csco9199.txt 估计 尾 指数 . 
7.4 文件 d-hwp3dx8099.txt 含有 Hewlett-Packard. CRSP 价值 加 权 指 数 、 等 权重 指数 和 


S&P 500 指数 从 1980 年 到 1999 年 的 日 对 数 收 益 率 , 所 有 的 收益 率 都 以 百分比 表示 , 并 
且 包 含 红利 分 布 . 假定 感 兴趣 的 尾 概率 为 0.01. 对 下 面 的 金融 头寸 计算 2000 年 第 一 个 交 
易 日 的 风险 值 . 

(a) 持 有 100 万 美元 的 Hewlett-Packard 股票 和 100 万 美元 S&P500 指数 的 多 头 , 并 且 
使 用 风险 度量 制 方 法 . 对 每 个 序列 都 需要 估计 IGARCH(1,1) 模型 的 a RA. 

(b) 与 (a) 有 同样 的 头寸 , 但 是 对 每 个 序列 利用 一 个 一 维 ARMA-GARCH 模型 . 

(c) 对 持 有 100 万 美元 的 Hewlett-Packard 股票 的 多 头 , 利用 一 个 二 维 非 齐 次 泊 松 模型 ， 
解释 变量 如 下 : (D 年 时 间 趋 势 ; @ 对 Hewlett-Packard 股票 基于 GARCH 模型 拟 
合 的 波动 率 ; @ 对 S&P500 指数 基于 高 斯 GARCH 模型 拟 合 的 波动 率 ; © 对 价值 加 
权 指 数 收 益 基 于 高 斯 GARCH 模型 拟 合 的 波动 率 . 对 拟 合 的 模型 实施 诊断 检验 . 由 
S&P500 指数 与 价值 加 权 指 数 收 益 率 测量 的 市 场 波动 率 在 决定 Hewlett-Packard 的 
股票 收益 率 的 尾行 为 上 有 意义 中 ? 你 可 以 选择 几 种 不 同 的 门限 . 


7.5 考虑 从 1980 年 到 2003 年 的 Alcoa(AA) 股票 和 S&P500 综合 指数 (SPX) 的 日 收益 率 . 


文件 d-aaspx8003.txt 包含 简单 收益 率 和 日 期 数据 ， 将 简单 收益 率 转换 为 对 数 收益 率 ， 
并 研究 Alcoa(AA) 股票 的 负 日 对 数 收益 率 . 
(a) 给 Alcoa(AA) 股票 的 负 对 数 收益 率 (以 百分比 的 形式 给 出 ) 拟 合 一 般 极 值 分 布 . 子 区 
间 的 长 度 是 21 个 交易 日 , 写 出 参数 估计 值 及 其 标准 误差 . 绘制 残 差 的 散 点 图 和 QQ 
图 . 
(b) 当 用 区 间 长 度 为 21 天 的 24 个 子 区 间 时 , 前 面 所 拟 合 模型 的 收益 率 水 平 是 多 少 ? 
(c) 当 门 限 为 2.5 多 时 , 绘制 负 的 对 数 收益 率 的 QQ 图 以 及 收益 率 的 超额 均值 图 . 
(d) 当 门 限 为 3.599], 给 负 的 对 数 收益 兴 拟 合 广义 帕 景 托 分 布 (GPD). 写 出 参数 估计 值 
及 其 标准 误差 . 
(e) 绘制 以 下 图 像 : 
(i) 超额 分 布 图 ; 
(ii) 标的 分 布 的 尾部 的 图 像 ; 
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(iii) 残 差 的 散 点 图 ; 
(iv) 所 拟 合 GPD 的 残 差 的 QQ A. 
(f) 基于 所 拟 合 的 GPD 模型 , 计算 概率 为 q — 0.95, 0.99 和 0.999 时 的 风险 值 (VaR) 和 
WERE. 
7.6 仍然 考虑 练习 题 7.5 中 的 Alcoa(AA) 股票 的 日 对 数 收 益 率 . 现在 我 们 关注 的 是 正 的 日 对 
数 收益 率 . 回答 练习 题 7.5 中 同样 的 问题 . 然而 , AWA GPD 模型 时 , 使 用 的 门限 为 3%. 
7.7 考虑 d-aaspx8003.txt 文件 中 S&P500 综合 指数 (SPX) 的 日 收益 率 . 将 收益 率 转换 为 
对 数 收益 率 , 并 研究 负 的 日 对 数 收益 率 . 
(a) 给 S&P500 综合 指数 的 负 对 数 收 益 率 (以 百分比 的 形式 给 出 ) 拟 合 一 般 极 值 分 布 . 子 
区 间 的 长 度 是 21 个 交易 日 . 写 出 参数 估计 值 及 其 标准 误差 . 绘制 残 差 的 散 点 图 和 QQ 
B. 
(b) 当 用 区 间 长 度 为 21 天 的 24 个 子 区 间 时 , 前 面 所 拟 合 模型 的 收益 率 水 平 是 多 少 ? 
(c) 当 门 限 为 2.5 咒 时 , 绘制 负 的 对 数 收 益 率 的 QQ 图 以 及 收益 率 的 超额 均值 图 . 
(d) 当 门 限 为 2.5% 时 , 给 负 的 对 数 收 益 率 拟 合 GPD. 写 出 参数 估计 值 及 其 标准 误差 . 
(e) 绘制 以 下 图 像 ; 
(i) 超额 分 布 图 ; 
(ii) 标的 分 布 的 尾部 的 图 像 : 
(ii) 残 差 的 散 点 图 ; 
(iv) 所 拟 合 GPD 的 残 差 的 QQ A. 
(f) 基于 所 拟 合 的 GPD 模型 , 计算 概率 为 4 = 0.95, 0.99 和 0.999 时 的 风险 值 (VaR) 和 
期 望 不 足 (expected shortfall). 
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近年 来 , 经 济 全 球 化 与 网 络 交流 已 经 加 速 了 世界 金融 市 场 的 一 体 化 . 单个 市 场 
的 价格 变动 能 够 很 容易 迅速 地 扩散 到 另 一 个 市 场 . 因此 , 金融 市 场 比 以 前 更 加 相互 
依赖 了 . 为 了 更 好 地 理解 全 球 金融 的 动态 结构 , 必须 将 它们 联合 起 来 考虑 . 在 某 些 
情况 下 , 一 个 市 场 可 能 引导 另 个 市 场 , 然而 在 其 他 情形 下 这 种 关系 也 可 能 颠倒 过 
来 . 因此 , 了 解 市 场 如 何 相互 关联 在 金融 中 相当 重要 . 类 似 地 , 对 持 有 多 个 资产 的 
投资 者 或 金融 机 构 , 资产 收益 率 间 的 动态 关系 在 决策 制定 的 过 程 中 起 着 很 重要 的 作 
用 . 本 章 和 第 9 章 引 进 有 用 的 金融 计量 经 济 学 模型 和 方法 来 联合 研究 多 元 收益 率 
序列 . 在 统计 文献 中 , 这 些 模型 和 方法 属于 向 量 或 多 元 时 间 序 列 分 析 . 

多 元 时 间 序 列 包含 多 个 一 元 时 间 序 列 作为 其 分 量 . 因此 , 向 量 与 矩阵 的 概念 在 
多 元 时 间 序 列 分 析 中 非常 重要 . 如 有 必要 , 读者 可 以 查阅 本 章 中 的 附录 A 来 了 解 问 
量 和 和 矩阵 的 一 些 基 本 运算 和 性 质 ， 附 录 B 给 出 了 多 元 正 态 分 布 的 一 些 结果 , JF B. 
这 些 结果 在 多 元 统计 分 析 中 应 用 很 广泛 (如 Johnson 和 Wichern 1998). 

4 ri = (ruras Tee)! 表示 上 个 资产 在 时 刻 t 的 对 数 收 益 率 , 这 里 a' 表示 
a 的 转 置 . 例如 , 一 个 投资 者 持 有 IBM, 微软 公司 、 埃 克 森 美孚 公司 、 通 用 汽车 公司 
和 沃尔玛 超市 的 股票 , 则 他 可 能 考虑 由 这 些 公司 的 日 对 数 收益 率 所 构成 的 5 维 问 
量 . 这 里 rt 表示 IBM 股票 的 日 对 数 收 益 , ro. 表示 微软 的 , 等 等 . 再 如 , 一 个 对 全 
球 投资 感 兴趣 的 投资 者 , 可 能 考虑 美国 S&P500 指数 、 英 国 FTSE100 指数 以 及 日 
木 的 Nikkei225 指数 的 收益 率 序列 . 这 时 序列 是 3 元 的 , rt 表示 S&P500 指数 的 收 
益 率 ; roe 表示 FTSE100 指数 的 收益 率 ; ra, 表示 Nikkei225 指数 的 收益 率 . 本 章 的 
目的 是 研究 一 些 计 量 经 济 模型 来 分 析 多 元 过 程 re 

前 几 章 中 讨论 的 许多 模型 和 方法 可 以 直接 推广 为 多 元 的 情形 .但 是 在 有 些 情 
形 下 , 这 种 推广 需要 注意 一 些 问题 . 在 某 些 情形 下 , 需要 新 的 模型 和 方法 来 处 理 多 
个 收益 率 之 间 的 复杂 关系 . 本 章 对 这 些 问题 的 讨论 强调 直观 性 和 实用 性 . 关于 多 元 
时 间 序 列 分 析 的 统计 理论 , 读者 可 以 参考 Liitkepohl(1991) 和 Reinsel(1993). 


8.1 8p S SEX-—TIHBXABE 


考虑 一 个 k 元 时 间 序 列 45 aem (rit, T2677 Te)’. 称 序 列 T, te 9^ fa IJ, 如 果 
它 的 一 阶 矩 与 二 阶 矩 不 随时 间 变 化 . 特别 地 , 弱 平 稳 序 列 v, 的 均值 向 量 和 协 方差 
和 矩阵 不 随时 间 改 变 . 除非 明确 地 说 明 序 列 非 平稳 , 我 们 都 假定 金融 资产 的 收益 序列 
是 弱 平稳 的 . 
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对 一 个 弱 平稳 时 间 序 列 re, 其 均值 向 量 和 协 方差 矩阵 定义 为 
H= E(ri To — El(ri— a)(ri — n). (8.1) 


ix BINDER Hor. 的 联合 分 布 对 每 个 分 量 取 期 望 得 到 的 . 均值 六 是 由 ns 的 分 量 
的 无 条 件 期 望 组 成 的 上 维 向 量 . 协 方差 矩阵 To FE kx k BE. To 的 第 i 个 对 角 线 
上 上 的 元 素 是 Tit 的 方差 ， 而 lo 的 第 (7,7) 个 元 素 是 Ti 5 Vit 的 协 方差 . 需要 用 到 
其 元 素 时 , 我 们 记 

Me (pis sp) To = (T;4(0)). 
8.1.1 交叉 -相关 和 矩阵 

令 D 表示 由 rali=1, .k) 的 标准 差 构 成 的 上 x 对 角 和 矩阵 . 换 句 话说， 

D = diag { YT (0), + T (0)) 

则 v, 的 同步 或 延迟 为 0 的 交叉 -相关 和 矩阵 定义 为 
Po = [pij(0)] = D^! To D". 
更 具体 地 , po 的 第 (i,j) 个 元 素 为 
; (0) - Ti;(0) = Cov(riz, rji) 
dn Far; (0)  std(ru)std(rj)' 

BE ra 5 ra 间 的 相关 系数 . 在 时 间 序 列 分 析 中 , 此 相关 系数 称 为 共 点 或 同步 相 
KRM, 因为 它 是 两 个 序列 在 同一 时 刻 + 的 相关 性 ， 很 容易 看 出 Pry(0) = pyi(0), 
—1 < p4 (0) < 1; E p(0) — 1, 1 € à,j <k. 因此 , p(0) 是 具有 单位 对 角 元 素 的 对 称 
矩阵. 

多 元 时 间 序 列 分 析 中 一 个 重要 的 主题 是 分 量 序列 之 间 的 引导 -延迟 关系 (lead- 
lag). 为 此 , 用 交叉 -相关 和 矩阵 来 衡量 时 间 序 列 之 间 线 性 依赖 的 强度 . re 的 延迟 为 / 
的 交叉 协 方差 矩阵 定义 为 

Tz [Ea (1)] = E((r, — pn)(rii— ny]. (8.2) 


其 中 u 是 x 的 均值 向 量 . 因此 , ©, 的 第 (i, 7) 个 元 素 为 r， 与 rje 间 的 协 方差 . 
对 弱 平 稳 序 列 , 交叉 - 协 方差 矩阵 r 是 1 的 函数 , 与 时 间 指 数 t 无 关 . 
ri 的 延迟 为 1 的 交叉 -相关 矩阵 (lag-l cross-correlation matrix, CCM) 定义 为 


P: = [p50)) = D nD, (8.3) 
这 里 同 前 面 一 样 , D 是 由 单个 序列 ra 的 标准 差 构成 对 角 和 矩阵 , 由 定义 
Tg (2) = Cov (Tit: rj 4—1) 


= ON Tt (8.4) 


pij (!) = VT); (0) std(r;,)std(r;,) 
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是 ri 与 rja 的 相关 系数 . 当 ! > 0 时 , 此 相关 系数 衡量 了 ri 对 发 生 在 t 时 刻 
以 前 的 ry. 的 线性 依赖 . 因此 , 如 果 pu) #0 Al > 0, 我 们 就 说 序列 rj, 在 延 
JR 1 处 引导 着 序列 ra. WMA, pll) 衡量 了 rj; 对 rie 的 线性 依赖 , 并 且 如 果 
piill) #0 且 1 > 0, 我们 就 说 ra 在 延迟 1 处 引导 着 序列 rje. (8:4) 式 还 表明 pill) 
的 对 角 元 素 恰 恰 为 ra 的 延迟 为 ! 的 自 相关 系数 . 

根据 上 述 讨论 , 我 们 得 到 当 ! > 0 时 , 交叉 -相关 阵 的 一 些 重要 性 质 . 首先 , 一 
般 地 , Xh i Z j, 有 pull) A pal), 这 是 因为 这 两 个 相关 系数 衡量 的 是 {ra} 与 {ry} 
之 间 的 不 同 的 线性 关系 . 因此 , Ti 与 p, 一 般 是 不 对 称 的 . 其 次 , 由 Cov(ri rj) 一 
Cov(rjt_writ), 以 及 弱 平稳 性 假定 , 我 们 有 

Cov (Tit, rj4—1) = Cov(rja- 5 rit) = Cov (rji: Titt) 一 Cov[rityrit 一 (一 中 

因此 rault) = Call). 因为 Call) 为 矩阵 T, 的 第 (j,i) 个 元 素 , 且 这 个 等 式 对 
1 < i,j < 成 立 , 所 以 我 们 有 T; — T' n pi = pL. 因此 , 与 一 元 情形 不 同 , 对 一 般 
的 向 量 时 间 序 列 来 说 , 当 ! > 0 时 , pi 关 p_i. 因为 pj = p n 所 以 在 实际 中 , 只 考虑 
12 0 时 的 交叉 -相关 甜 阵 o, 就 足够 了 . 
8.1.2 ”线性 相依 性 


综合 起 来 , 一 个 弱 平稳 向 量 时 间 序 列 的 交叉 -相关 矩阵 {pll = 0,1,…} 包含 下 
面 的 信息 . 

(1) 对 角 元 素 {pall = 0,1,---} Æ rit 的 自 相 关 函 数 . 

(2) 非 对 角 元 素 pii(0) 衡量 的 是 Tit 5 T jt 之 间 的 同步 线性 关系 . 

(3) 对 ! > 0, 非 对 角 元 素 p, 0) 衡量 的 是 ra 对 过 去 值 rje 的 线性 依赖 . 
因此 , 如 果 对 所 有 的 1 > 0, 都 有 pi;(1) = 0, W ras 并 不 线性 地 依赖 于 rj 序列 的 任 
何 过 去 值 rje 1. 

一 般 地 , 两 个 时 间 序 列 (r4) 与 (rj) 之 间 的 线性 关系 可 以 概括 如 下 . 

(1) 如 果 对 于 所 有 的 1> 0, 都 有 pyll) — palt) = 0, JU rie 与 rj 没有 线性 关系 . 

(2) 如 果 pi (0) A 0, BU ri Ej rg 是 同步 相关 的 . 

(3) 如 果 对 于 所 有 的 1>0, pis (tl) — 0 E pj;(1) — 0, WW rie 与 rit 没有 引导 -延迟 
关系 . 这 时 称 这 两 个 序列 是 分 离 的 . 

(4) 如 果 对 于 所 有 的 1 > 0, pi;(1) = 0, 但 是 对 某 些 v > 0, 有 pji(v) z 0, WA 
ri, 到 Tjt 有 一 个 单 向 关系 . 此 时 , rie 并 不 依赖 于 Tjt 的 任何 过 去 值 , 但 是 ryt 却 依 
MF ru 的 某 些 过 去 值 . 

(5) 如 果 对 某 些 ! > 0, pult) A 0; 而 且 对 某 些 v>0, palu) £0, JU re 与 ?it 之 
间 具 有 一 种 反馈 关系 . 

前 面 陈 述 的 条 件 都 是 充分 条 件 . 研究 时 间 序 列 之 间 关 系 的 更 加 有 效 的 方法 是 对 序列 
构造 一 个 多 元 模型 , 因为 一 个 恰当 特定 的 模型 同时 考虑 了 该 时 间 序 列 的 序列 相关 性 
及 序列 之 间 的 交叉 相关 性 . 
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8.1.3 ”样本 交叉 -相关 和 矩阵 
给 定数 据 {Tilt = 1, Th 其 交叉 -内 方差 矩阵 T, 可 以 通过 下 式 估计 


" 
a 1 
fog m nas) 1» (8.5) 


这 里 未 二 X r /T 为 样本 均值 向 量 . 交叉 _ 相 关 和 矩阵 p, 的 估计 为 


t—1 


^ - 


=D AB. iz (8.6) 


其 中 D 是 分 量 序 列 的 样本 标准 差 构 成 的 有 x 上 对 角 和 矩阵 . 

类 似 于 一 元 情形 , 样本 交叉 -相关 和 矩阵 pl 的 渐 近 性 质 在 各 种 假定 之 下 都 已 给 

予 研究 了 . 例如 可 以 参见 Fuller (1976, 第 6 章 ). 这 个 估计 是 相合 的 , 但 对 于 有 限 
样本 是 有 偏 的 . 对 于 资产 收益 率 序列 , p, 的 有 限 样本 分 布 相 当 复 杂 , 部 分 原因 是 由 
于 条 件 异 方差 与 高 峰 度 的 出 现 . 如 果 需 要 交叉 -相关 的 有 限 样 本 分 布 , 我 们 建议 利 
用 适当 的 自助 (bootstrap) 重新 抽样 方法 得 到 分 布 的 近似 估计 . 对 于 许多 应 用 而 言 ， 
pig (1) 方差 的 一 个 粗糙 估计 就 足够 了 . 
例 8.1 ”考虑 IBM 股票 与 S&P500 指数 从 1926 年 1 HÆ 1999 年 12 月 的 月 对 数 
收益 率 , 共 sss 个 观测 值 . 该 收益 率 包 括 了 红利 支付 , 并 且 以 百分比 表示 . 分 别 用 
rit 和 ra 表示 IBM 股票 与 S&P500 指数 的 收益 率 . 这 两 个 收益 率 组 成 了 一 个 二 元 
的 时 间 序 列 re = (rus roe)’. 图 8-1 给 出 了 同样 尺度 的 m 的 时 间 图 , 图 8-2 给 出 了 
两 个 序列 的 一 些 散 点 图 ， 这些 图 像 表明 这 两 个 时 间 序 列 是 同步 相关 的 . 事实 上 , 两 
个 收益 率 之 间 的 样本 同步 相关 系数 是 0.64, 这 在 5% 水 平 下 是 统计 显著 的 . 然而 , 1 
步 延 迟 的 交叉 -相关 若 有 的 话 也 是 很 弱 的 . 


(a) IBM 股 票 的 月 对 数 收益 率 : 1962 年 1 月 到 1999 年 12 月 


1940 1960 1980 2000 


年 
(b) S & P500 指 数 的 月 对 数 收益 率 : 1926 年 1 月 到 1999 年 12 月 


1940 1960 L980 2000 
年 


图 8-1 IBM 股票 (a) 与 S&P500 指数 (b) 从 1926 年 1 月 至 1999 年 12 月 的 
月 对 数 收 益 率 的 时 间 图 
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图 8-2 IBM 股票 与 S& P500 指数 的 月 对 数 收 益 率 的 一 些 散 点 图 : (a) TBM 股票 与 S& P500 
指数 的 同步 图 ; (b) S&P500 对 延迟 1 步 的 IBM; (c) IBM 对 延迟 1 步 的 S&P 500; 
(d) S&P500 对 延迟 1 步 的 S&P500 


表 8-1 给 出 了 山 个 序 州 的 一 些 概括 性 统计 量 与 交 又 -相关 矩阵， 对 一 个 二 元 序 
列 , 每 个 CCM 都 是 一 个 2 x 2 矩阵 , 包含 4 个 相关 系数 . 实 让 经 验 表明 很 难 同 时 骸 
收 许多 的 交叉 -相关 矩阵 , 尤其 是 当 维 数 上 大 于 3 时 . 为 了 克服 这 个 困难 , 我 们 利 
用 Tiao 和 Box (1981) 的 简化 记号 , 并 且 定 义 一 个 简单 的 交叉 -相关 甜 阵 , 它 包含 三 
个 符号 e, e—a A n ep 

(1) “+4” 意味 着 相应 的 相关 系数 大 于 或 等 于 2/VT; 

(2) “—" 意味 着 相应 的 相关 系数 小 于 或 等 于 —2/ VT; 

(3) “” 意 味 着 相应 的 相关 系数 介 于 一 2/VT 5 2//T 之 间 : 
此 处 2/ VT 是 假定 re 为 一 个 白 噪 声 时 , 在 5% 渐 近 水 平 下 样本 相关 系数 的 临界 值 . 

表 s-1c 给 出 了 IBM 股票 与 S&P500 指数 的 月 对 数 收益 率 的 简化 COM. 很 容 
易 看 出 在 5%% 渐 近 水 平 上 显著 的 交叉 -相关 主要 出 现在 延迟 1 和 延迟 3 处 . 检查 这 
两 个 延迟 的 样本 COM 可 见 : (a) S&P500 指数 的 收益 率 在 延迟 1 与 延迟 3 处 有 某 
些 边 际 自 相 关 性 ; (b) IBM 股票 收益 率 对 S&P500 指数 的 过 去 收益 率 的 依赖 关系 很 
88. 后 一 观测 是 根据 父 叉 -相关 在 延迟 1 与 延迟 3 处 的 COM 的 第 (1,2) 个 元 素 的 
显著 性 . 

图 8-3 显示 了 两 个 序列 的 样本 自 相 关 与 样本 交叉 相关 . 对 延迟 为 0 的 ACF 而 
言 是 对 称 的 , 我 们 只 给 出 了 具有 正 的 延迟 值 的 ACF. 因为 使 用 S&P500 指数 收益 率 
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表 8-1 IBM 股票 和 S&P500 指数 的 月 对 数 收益 率 的 概括 性 统计 量 和 交叉 -相关 和 矩 阵 
(时 间 段 是 1926 年 1 月 至 1999 年 12 月 ) 

(a) 概括 性 统计 量 
最 小 变动 价位 均值 标准 误差 偏 度 超额 巍 度 最 小 值 最 大 值 
IBM 1.240 6.729 一 0.237 1.917 一 30.37 30.10 
S&P5 0.537 5.645 —0.521 8.117 —35.58 35.22 

(b) ZX-A 

延迟 1 延迟 2 ALU 3 延迟 4 HEIR 5 

0.08 0.10 0.02 —0.06 —0.02 —0.07 —0.02 —0.03 0.00 0.07 
0.04 0.08 0.02 —0.02 —0.07 —0.11 0.04 0.02 0.00 0.08 


RO qe M EM UG 


的 延迟 值 来 计算 交叉 -相关 , 所 以 图 8-3c "P5 IE SERRE IR EL RA H T IBM 股票 收 
益 率 对 过 去 的 S&P500 指数 收益 率 的 依赖 性 ; 与 负 延 迟 相 联 系 的 图 给 出 了 S&P500 
指数 收益 率 对 过 去 的 TBM 股票 收益 率 的 线性 依赖 性 . 图 中 的 水 平 线 是 样本 自 相 关 
与 样本 交叉 -相关 系数 的 两 个 渐 近 标准 差 的 上 下 限 . 从 图 中 可 以 看 出 , 两 个 收益 率 


(a) 
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图 8-3 ”两 个 月 对 数 收益 率 的 样本 自 相 关 和 交叉 -相关 函数 : (a) IBM 股票 收益 率 的 样本 ACF; 


(b) S&P500 指数 收益 率 的 样本 ACF; (c) IBM 的 收益 率 和 S&P500 指数 收益 率 的 延 
iR f fs XC BOXER C 
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之 间 的 动态 关系 非常 弱 , 但 是 它们 的 同步 相关 却 是 统计 显著 的 ， 


图 8-4 


例 8.2 


(a) 


1940 1950 1960 1970 1980 1990 2000 
年 
(b) 
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(d) 
10 
E10 Yr 
1940 1950 1960 1970 1980 1990 2000 
年 
(e) 
Me 10 
EH-—-— — ————] 
1940 1950 1960 1970 1980 1990 2000 
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美国 政府 债券 的 月 简单 收益 率 的 时 间 图 , 期 限 分 别 是 (a) 30 年 期 限 ; (b) 20 年 期 限 ; 
(c) 10 年 期 限 ; (d) 5 年 期 限 ; (e) 1 EWR. 样本 时 间 段 是 1942 年 1 月 至 1999 年 
12 A 


考虑 期 限 分 别 为 30 年 、20 年 , 10 年 .5 年 和 1 年 的 美国 政府 债券 指数 的 
月 简单 收益 率 . 数据 来 自 于 CRSP 数据 库 , 样本 期 间 为 1942 年 1 月 至 1999 年 12 
月 , 共 696 个 观测 值 . 令 re = (ries orae) 为 具有 递减 的 剩余 期 限 的 收益 率 序列 . 
8-4 给 出 了 同样 尺寸 的 v, 的 时 间 图 . 1 年 债券 收益 率 的 可 变性 远 远 小 于 较 长 期 


限 的 收益 率 的 可 变性 . 数据 的 样本 均值 和 标准 差分 别 为 


je = 107? (0.43, 0.45, 0.45, 0.46, 0.44)’, 


& = 10~*(2.53, 2.43, 1.97, 1.39, 0.53)’. 


序列 的 同步 相关 和 矩阵 为 
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1.00 0.98 0.92 0.85 0.63 
0.98 1.00 0.91 0.86 0.64 
Po = | 0.92 0.91 1.00 0.90 0.68 
0.85 0.86 0.90 1.00 0.82 
0.63 0.64 0.68 0.82 1.00 
出 现下 列 现 象 并 不 奇怪 : 

(a) 序列 有 高 度 的 同步 相关 性 ; 

(b) 长 期 债券 之 间 的 相关 要 高 丁 短期 债券 之 间 的 相关 . 

XX 8-2 给 出 了 re 的 延迟 为 1 处 与 延迟 为 2 处 的 交叉 -相关 和 矩阵 以 及 相应 的 简 
化 矩阵 . 绝 大 多 数 显著 的 交叉 -相关 在 延迟 1 处 , 而 且 5 个 收益 序列 看 上 去 是 交互 
相关 的 . 另外 , 1 年 期 债券 收益 率 的 延迟 为 1 处 与 延迟 为 2 处 的 样本 ACE 高 于 其 
他 较 长 期 限 序列 的 相应 延迟 的 ACP. 


表 8-2 美国 政府 债券 的 5 个 指数 的 月 简单 收益 率 的 样本 交叉 -相关 和 矩阵 , 时 间 段 是 1942 
年 1 月 至 1999 年 12 月 
延迟 1 延迟 2 
交叉 -相关 矩阵 


0,00 一 0.03 
一 0.01 0.00 0,00 —0.04 0.02 

0.01 0.01 0.01 —0.02 0.07 
一 0.02 —0.01 0.00 —0.04 0.07 
0.02 0.02 


0.10 0.08 0.12 0.14 0.17 
0.09 0.08 0.09 0.13 0.18 


简化 的 交叉 -相关 矩阵 


8.1.4 多 元 混成 检验 


Hosking(1980, 1981) 以 及 Li 和 McLeod (1981) 已 经 把 一 元 的 Ljung-Box 统 
计量 Q(m) 推广 到 了 多 元 情形 . 对 一 个 多 元 序列 , 检验 统计 量 的 零 假设 为 Ho: 
Pi =- = pm = 0, 备 择 假设 为 Ha : 对 某 些 ;ie {1,… m], p; 4 0. 这 样 , 就 利用 
这 个 统计 量 来 检验 向 量 序列 v, 没有 自 相 关 或 交叉 相关 性 . 假定 检验 统计 量具 有 如 
下 形式 


bie 1 TEE S W EE 
Qi(m) =T? 3^ — itr(PiPo ft A (8.7) 


[一 1 
其 中 T 为 样本 容量 ,大 ry 的 维 数 , tr(A) 是 矩阵 4 的 迹 , 即 4 的 对 角 线 元 素 的 
和 . 在 零 假 设 以 及 一 些 正 则 条 件 下 , Qum) 渐 近 服从 一 个 自由 度 为 k?m 的 x? 分 布 . 
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注释 : — Qu(m) 统计 量 可 以 根据 样本 交叉 相关 短 阵 p, 改写 , 但 是 这 种 表示 涉 
及 Kronecker 积 Q 与 本 章 附 录 A 讨论 的 矩阵 的 向 量化 . 利用 这 些 算 子 , 我 们 有 


1 d aa NE 
Qx(m) = T* p ju Po " & pg )br, 
t= 


其 中 b= vec(pj). Li 4e Mcleod (1981) 提出 的 检验 统计 量 为 


k2m(m + 1) 


Qi(m) =T} b(n" Po )bi + — ST 


i=1 

它 渐 近 等 价 于 Qum). 口 

对 例 8.1 中 的 IBM 股票 与 S&P500 指数 的 二 元 月 对 数 收益 率 应 用 Qu(m) BE 
tht, 我 们 有 Q2(1) = 9.81, Qo(5) = 47.06, Qo(10) = 71.65. 根据 自由 度 为 4, 20 和 
40 的 渐 近 x? 分 布 , 可 得 到 这 些 Qo(m) 统计 量 的 p 值 分 别 为 0.044, 0.001 和 0.002. 
因此 , 混成 检验 进一步 确认 了 在 5 多 的 显著 性 水 平 下 该 二 元 收益 率 序 列 存在 序列 依 
E. 对 于 例 8.2 中 债券 指数 的 5 元 月 简单 收益 率 , 我 们 有 Qs(5) = 1 065.63, 与 自 
由 度 为 125 的 x? 分 布 相 比 较 , 它 是 高 度 显著 的 . 

Qu (ru) 统计 量 是 对 re 的 前 m 个 交叉 -相关 托 阵 的 一 个 联合 检验 . 如 果 零 假设 
被 拒绝 , 那么 我 们 必须 对 序列 建立 一 个 多 元 模型 来 研究 序列 分 量 之 间 的 引导 -延迟 
关系 . 下 面 我 们 讨论 一 些 简单 的 向 量 模型 . 它们 在 给 多 元 金融 时 间 序 列 的 线性 动态 
结构 建 模 时 很 有 用 . 


8.2 ” 问 量 自 回归 模型 


在 给 资产 收益 率 建 模 时 , 一 个 简单 有 用 的 向 量 模型 是 向 量 自 回归 (vector au- 
toregressive, 简 记 为 VAR) MAY. 称 多 元 时 间 序 列 re 服从 一 个 一 阶 的 VAR 过 程 ， 
或 者 简单 地 称 为 VAR(1), 如 果 它 服从 下 面 的 模型 


T; = Qo + Pri- + a, (8.8) 


这 里 o 是 一 个 大 维 向 量 , b JE —AS kx k 矩阵 , {a} 是 一 个 序列 不 相关 的 随机 向 
量 序列 , 其 均值 为 0, 协 方差 矩阵 为 X. 实际 应 用 中 , 要 求 协 方差 矩阵 Y: 是 正定 的 ; 
否则 , 可 以 简化 re 的 维 数 . 文献 中 , 通常 假定 a, 是 多 元 正 态 的 . 

考虑 二 元 情形 | 即 k= 2,r = (rit, rat)’ E. a= (ai.a2)]. X VAn(1) 模型 
包含 了 下 面 两 个 方程 : 


rie = O19 1171451 + 9197241 + ae, 


rot = 629 + Pairis—-1 + Poerer—1 + 221; 


8.2 ”向 量 自 回归 模型 ”303 


其 中 oe, 是 更 的 第 (ij) 个 元 素 , io 是 po 的 第 i 个 元 素 . 根据 第 一 个 方程 ， 51。 
表示 的 是 在 rii 存在 时 , rit 对 rari 的 线性 依赖 , 因此 zs 为 给 定 riei WY, 
rT24_1 对 ri 的 条 件 效应 . 如 果 bi = 0, 那么 rip 并 不 依赖 于 r2, 而 且 模 型 表 
Wry, 只 依赖 于 它 自 己 的 过 去 值 . 类 似 地 , 如 果 Pa = 0, 那么 第 二 个 方程 表明 了 给 
定 T2,t—1 时 ， T2t 并 不 依赖 于 T1,—1- 

联合 考虑 这 两 个 方程 . 如 果 yo = 0, 但 是 So, 7 0, 那么 从 riz 到 roe 有 一 个 单 
向 关系 . 如 果 Oo — d», = 0, 那么 ri Sra 是 分 离 的 . WR 1o #0, A O £0, 
那么 这 两 个 序列 之 间 有 一 个 反馈 关系 . 


8.2.1 简化 形式 和 结构 形式 


一 般 地 , (8.8) 式 的 系数 矩阵 更 度量 了 ri 的 动态 相依 性 . re 与 ra 之 间 的 同步 
关系 可 以 通过 a, 的 自 协 方差 矩阵 X. 的 非 对 角 线 元 素 oi 来 反映 . 如 果 012 = 0, 那 
么 这 两 个 分 量 序列 之 间 没 有 同步 线性 关系 .在 计量 经 济 文献 中 , (8.8) 式 中 的 VAR(1) 
模型 称 为 简化 形式 的 模型 , 因为 它 没 有 清楚 地 给 出 分 量 序列 之 间 的 同步 相依 性 . 如 
果 有 必要 , 我 们 可 以 通过 对 简化 形式 的 模型 作 一 个 简单 的 线性 变换 得 到 包含 同步 关 
系 的 一 个 显 式 表达 . 因为 X 是 正定 的 , 所 以 存在 一 个 对 角 线 上 元 素 全 为 1 的 下 三 
角 和 矩阵 L 以 及 对 角 和 矩阵 G. 满足  — LGL. 参见 附录 A 中 的 Cholesky 分 解 . Al 
yt, DSL’) —G. 

定义 b, 一 (bit, - by) = L'ai 则 


Elb) =L E(a:)=0, Cov(b)- LL TD Y=L DL) !=6G. 


因为 G ÆRE, 所 以 b, 的 分 量 是 不 相关 的 . 在 (8.8) 式 中 的 两 端 同时 左 乘 
Lo", 我 们 得 到 


L ry = Dy + DO Ory_ + Lay = h) + Bri + by, (8.9) 


其 中 gr = Lp 是 一 个 上 HEE, 而 且 6*— 1 @ FE x bE. 因为 这 个 特 
殊 的 矩阵 结构 , L^! 的 第 大 行 具有 形式 (wer, wk- weer, 1). 因此 , 模型 (8.9) 
的 第 大 个 方程 为 
k-1 k 
Tee + So wiira =z ko m S Shirin + bres (8.10) 
i=1 i=1 
这 里 dlo 是 oo 的 第 大 个 元 素 , i. 是 更 * 的 第 (ko) 个 元 素 . 因为 对 1 <i ck, 
by, 与 bin 是 不 相关 的 , 所 以 (8.10) 式 明 确 给 出 了 ree 对 rie 的 同步 线性 依赖 性 , 其 
中 1<i<k 一 1. 在 计量 经 济 文献 中 , 该 式 称 为 rkt 的 一 个 结构 方程 . 
对 or. 的 任何 其 他 分 量 ru. 我 们 可 以 对 VAR(1) 异型 进行 重 排 , 使 得 ri 变 为 
re 的 最 后 一 个 分 量 ， 可 以 利用 前 面 的 变换 方法 来 得 到 va 的 一 个 结构 方程 . 因此， 
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(8.8) 式 的 简化 形式 的 模型 等 价 于 计量 文献 中 使 用 的 结构 形式 . 在 时 间 序 列 分 析 中 ， 
通常 使 用 简化 形式 的 模型 , 原因 有 两 个 : 第 一 个 原因 是 易于 估计 ; 第 二 个 , 也 是 主要 
的 原因 , 是 在 预测 时 不 能 用 同步 相关 性 . 

例 8.3 为 了 说 明 从 简化 形式 模型 到 结构 方程 的 变换 , 考虑 二 元 AR(1) 模型 


||| 0.2 A qd z-|i 1, 
T2t 0.4 —0.6 1.1 Tapi at E d 
对 这 个 特殊 的 自 协 方差 第 阵 X, 下 三 角 和 矩阵 
os | 1.0 E 
—0.5 1.0 
给 出 了 一 个 Cholesky 4H (Bl. 五 (L/)-! 是 一 个 对 角 阵 )， 将 前 面 的 二 元 AR(1) 
模型 左 乘 上 因子 LO ,我们 得 到 


| 1.0 rd pa | RJ | 0.2 0.3 | [ue | fr | 
= + + ; 
—0.5 1.0 Tot 0.3 一 0.7 0.95 T2.1—1 bo, 
és | 2 0 | | 
0 0.5 
这 里 G = Cov(b,). 这 个 变换 模型 的 第 二 个 方程 为 


ra = 0.3 + 0.5r3, — 0.77141 + 0.95r2 4.1 + bat. 


该 方程 明确 给 出 了 ro 对 mu 的 线性 依赖 . 
重新 安排 re 中 元 素 的 顺序 , 则 二 元 AR(1) 模型 变 为 


Tat T 0.4 i 1.1 一 0.6 T21—1 d Oot . Be Lh d | 
The 0.2 0.3 0.2 (i 011 Lr X 


TE Y f] Cholesky 分 解 中 需要 的 下 三 角 矩 阵 变 为 
pis 1.0 0.0 
I= 20] 


将 前 面 重 排 的 VAR(1) 模型 前 乘 以 工 -!, 我 们 得 到 
| 1.0 ai HSI o |*| —0.6 | a h 
—l0 1.0 Tit 一 0.2 一 0.8 0.8 Tht=i Cat 
G- | 4. | 
0 1 
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其 中 G = Cov(ct). 现在 第 二 个 方程 给 出 
Tj, = —0.2 + 1.0r2, — 0.8r24¢—1 + 0.871 ¢~1 + €21. 


这 个 方程 再 一 次 明确 给 出 了 Tit 对 r2t 的 同步 线性 依赖 性 . 
8.2.2 VAR(1) 模型 的 平稳 性 条 件 和 和 撼 


假定 (8.8) 式 中 的 VAR(1) 模型 是 弱 平稳 的 . 对 这 个 模型 取 期 望 , 利用 Elai) = 
0, 我 们 得 到 
E(r,) — po + $E(r,1). 


因为 Elri) 不 随时 间 变 化 , 假定 矩阵 工 一 更 是 非 奇异 的 , 则 我 们 有 
p = Elri) = (1—8) ġo: 


其 中 工 是 大 x 大 单位 矩阵 . 
利用 ġo — (I — )p, 则 (8.8) 式 中 的 VAR(L) 模型 可 以 写 为 


(Te — pr) = 9(r.-1 — H) + ay. 
令 元 = 中 一 凡是 均值 修正 的 时 间 序 列 , 则 VAR(1) 模型 变 为 
Ft = T.i + a. (8.11) 


这 个 模型 可 以 用 来 推导 出 VAR(1) 模型 的 性 质 . 通过 重复 迭代 , 我 们 可 以 将 (8.11) 
式 改 写 为 


T: = at | 9a, , | arz F Ps . 


这 个 表示 给 出 了 VAR(1) 过 程 的 几 个 特征 第 一 , 因为 a. 是 序列 无 关 的 ， 从 而 
Cov(a,,r, ,) = 0. 事实 上 , MAAN 1» 0 , a 与 re 都 是 不 相关 的 . 由 于 这 个 原 
因 , 将 a, 称 为 序列 在 时 刻 t 的 一 个 扰动 或 新 息 . 可 以 证 明 , 同一 元 的 情形 类 似 , 对 
所 有 的 时 间 序 列 模型 , o 与 过 去 值 rl > 0) 是 不 相关 的 , 第 二 , 将 这 个 表示 右 乘 
以 a; 后 取 期 望 , 并 利用 过 程 a, 的 不 相关 性 , 我 们 得 到 Cov(r,,ar) = X. 第 三 , 对 
于 一 个 VAR(1) BUS, r, 以 系数 矩阵 ©) 依赖 于 过 去 的 信息 a，;. 为 了 这 种 相依 性 
有 意义 , 4 j 00 时 , © 必须 收敛 到 0. 这 意味 着 更 的 上 个 特征 值 的 模 必 须 都 小 
于 1; 否则 , 当 j 一 co 时 , 4) BARK, 要 公会 收敛 到 一 个 不 为 0 的 矩阵 , 事实 上 ， 
WREE a, 的 自 协 方差 矩阵 存在 , MAER © 的 所 有 特征 值 的 模 都 小 于 1, 这 正 
是 r, 弱 平 稳 的 充分 必要 条 件 . 注意 到 对 一 元 AR(1) 情形 , 这 个 平稳 性 条 件 简化 为 


ll < 1. 另外 , 因为 


1 


IT 一 更 | = A" r-e]: 
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AX 更 的 特征 根 是 行列 式 | — 9 B| 的 零点 的 倒数 . 因此 >, 平稳 的 一 个 等 价 的 充 要 
条 件 是 行列 式 je) 的 所 有 零点 的 模 都 大 于 1, 即 | 更 (了 | 的 所 有 零点 在 复 平面 上 
都 位 于 单位 圆 外 . 第 四 , 利用 这 个 表示 , 我 们 有 


Cov(r;) = y = E +PEP + 2D (G7) -...— V 9x(9y 


Me 


il 
o 


t 


其 中 e? — 7, BI kx k HE. 
将 (8.11) 式 两 端 右 乘 以 7, , 后 取 期 望 , 并 利用 对 于 ) > 0, 有 Covlas r j)^ 
Elat, i) = 0 的 结果 , 我 们 得 到 


ETET) = 9 E(r, iT, ,). l > 0. 


因此 
P= pi i>, (8.12) 


其 中 工 ; or, 的 延迟 为 j 的 交叉 - 协 方差 矩阵 . 这 个 结果 又 是 一 元 AR(1) 过 程 的 
一 个 推广 . 
通过 重复 迭代 , (8.12) SCRI: 


I,—$9'Tg, 120. 
在 (8.12) 式 两 端 分 别 左 乘 D-/2 FARE D-/2 可 以 得 到 
pj = Dor 4D? =p “ep MD =p 
其 中 Y= DED. 因此 VAR(1) 模型 的 CCM 满足 
P=Y'po, l0. 


8.2.3 向量 AR(p) 模型 


VAR(1) 模型 可 以 直接 推广 到 VAR(p) 模型 . 称 时 间 序 列 v, 服从 一 个 VAR(p) 
模型 , 如 果 它 满足 


T, = b+ Pires +--+ Or» + Qt, p> 0, (8.13) 


其 中 o, 与 a, 如 前 所 定义 , 9; 是 kx k XRPE. 利用 向 后 推移 算 子 B, VAR(p) 模型 
可 以 写 为 
请 一 有 二 = Py + a, 


HEP I FÈ k x k PALERE. 这 个 表示 可 以 写 为 一 个 更 紧凑 的 形式 


P(B)r; = Po + ay, 


8.2 向 量 自 回归 模型 307 


其 中 更 (也 ) = 1-6, B-.-.—,B? 是 一 个 矩阵 多 项 式 . 如 果 rv, 是 弱 平稳 的 , 并 假 
定 逆 存在 , 则 我 们 有 


p= E(ri) = (E — 9, — -+- = &,)7 d, = [B(1)] o: 
4r=r,—p, Wl VAR(p) 模型 变 为 
Te = 5T, 1o @,7 tp + ar. (8.14) 


利用 这 个 方程 以 及 与 对 VAR (1) 模型 同样 的 方法 , 我 们 得 到 

e Cov(ri,at) =B, E Æ a, 的 协 方差 矩阵 ; 

e Cov(ry_1,a4) —0, 120; 

oD, = OT i-1 +--+ @,Fi-p, l0. 
最 后 一 个 性 质 称 为 VAR(p) BRAY RET Fi, 它 是 一 元 AR(p) 模型 的 Y-W 方程 (Yule- 
Walker equation) 的 多 元 形式 . 用 CCM 表示 , MEDED A 


Pi = Tip; 5 d TpPi_p: l > g. 


其 中 Y; = D'aD. 

理解 (8.13) 式 的 这 个 VAR(p) 模型 性 质 的 一 个 简单 方法 是 利用 (8.8) 式 中 
VAR(1) 模型 的 结果 , 可 以 通过 将 v, 的 VAR(p) 模型 变换 为 一 个 kp 元 的 VARCO) 
模型 得 到 . 具体 地 , > m, = (Fi pn Tpi P), be = (0, ,0, 01) 为 两 个 kp 
维 的 过 程 , be 的 均值 是 0, 自 协 方差 矩阵 是 一 个 kp x kp HME, 只 有 布下 角 的 元 素 不 
为 0, 用 X: 表示 . 这 样 , 关于 r: 的 VAR(p) 模型 可 写成 


Tt = $'r, + bi, (8.15) 
其 中 再 * 是 一 个 kp x kp 和 矩阵 ， 


cc 
© ^" 
=: "w O 
oo 
cc 


0 0 0 0 .. I 

S Mo Wed B c 4 
HOS I ADE k x k SRA ME. 文献 中 称 ^ 为 矩阵 多 项 式 @(B) 的 
fF Ri $2 (companion matrix). 

(8.15) 式 是 关于 ay 的 一 个 VAR(1) 模型 , 它 包 含 了 r 作为 它 的 最 后 k 个 分 量 . 
现在 可 以 通过 (8.15) 式 用 上 一 小 节 中 给 出 的 VAR(1) 模型 的 结果 来 推导 VAR(p) 
模型 的 性 质 . 例如 , 由 定义 , z 是 弱 平 稳 的 当 且 仅 当 v, 是 弱 平 稳 的 . 因此 , (8.13) 
AP VAR(p) 模型 弱 平 稳 的 充 要 条 件 是 (8.15) 式 中 @ 的 所 有 特征 值 的 模 都 小 于 
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1. 类 似 于 VAR(1) 模型 , 可 以 证 明 该 条 件 等 价 于 行列 式 | 更 (五 )| 的 所 有 根 都 在 单位 
圆 外 ， 

在 金融 时 间 序 列 分 析 中 特别 关心 的 是 VAR(p) 模型 的 系数 矩阵 e, 的 结构 . 例 
Ap, 如 果 对 所 有 的 1 , 9, 的 第 (ij) 个 元 素 9,0) 都 是 0, 则 rig 不 依赖 于 rj 的 过 
去 值 . 这 样 , 系数 矩阵 ©, 的 结构 给 出 了 r 的 分 量 之 间 的 引导 -延迟 关系 的 信息 ， 
8.2.4 ”建立 一 个 VAR(p) 模型 


我 们 继续 利用 定 阶 、 估 计 以 及 模型 检验 这 样 一 个 友 代 程序 来 对 给 定 的 时 间 序 
列 建立 一 个 向 量 AR 模型 . 一 元 序列 PACF(partial autocorrelation function, fi Él 
相关 函数 ) 的 概念 可 以 推广 到 多 元 情形 并 用 来 识别 向 量 序列 的 阶 p. 考虑 下 面 的 相 
邻 的 VAR 模型 : 


Te = $$ + Pirt-i + at, 
Te = Qo + Pirie + 9»r, 2 à, 


eee | n nk c 


TG = dy + ura + T Dirt + a4, (8.16) 


"et t t | onm 


这 些 模型 的 参数 可 以 通过 普通 最 小 二 乘 方法 (the ordinary least squares, 简称 OLS) 来 
估计 . 这 在 多 元 统计 分 析 中 称 为 多 元 线性 回归 估计 . 参见 Johnson 和 Wichern (1998). 

对 于 (8.16) 式 的 第 i 个 方程 , 令 & 表示 e, 的 OLS 估计 , 94 表示 by 的 估 
计 , 这 里 上 标 (i) 用 来 表示 估计 是 针对 VAR(i) 模型 的 , 则 残 差 为 


a" a A acia ieu 
XE i—0, 残 差 定义 为 FI =r — 7, 这 里 子 Ar, 的 样本 均值 . 残 差 的 自 协 方差 矩阵 
定义 为 " 

ee QE a (ay. ; 

Ñ, Tout De May i0. (8.17) 
为 了 确定 阶 p, 可 以 对 ! = 1,2,- 依次 检验 零 假 设 Ho : & = 0 对 备 择 假设 H, : 
$, 70. 例如 , 利用 (8.16) 式 中 第 一 个 方程 , 我 们 可 以 检验 零 假设 Ho : ® — 0, 与 
备 择 假设 Ha: 6, 40. 检验 统计 量 为 


t=- (a c 9s (Id 

M(1) (7 k 5) lr E) 

其 中 x, 的 定义 见 (8.17) aX, LA] 表示 矩阵 A 的 行列 式 . 在 一 些 正则 性 条 件 下 , 检 
验 统计 量 M(1) 渐 近 服从 自由 度 为 Kk? 的 x? 分 布 (参见 Tiao 和 Box(1981)). 
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一 般 地 , 我 们 利用 (8.16) 式 中 的 第 i 个 和 第 i -1 个 方程 来 检验 AD: ®, — 0 
对 Ha : D; 4-0, 也 就 是 说 检验 一 个 VAR(i) 模型 对 一 个 VAR(i — 1) 模型 . 检验 统 


计量 为 
ee a oe |=; 
M(i) = (1 k—i 5) In Ez) (8.18) 


M (i) 渐 近 服从 自由 度 为 k? 的 x? 分 布 . 

另 一 种 选择 是 利用 AIC(Akaike information criterion) 或 它 的 变形 来 选择 阶 p. 
假定 at 是 多 元 正 态 的 , 并 考虑 (8.16) 式 中 的 第 i 个 方程 , 可 以 用 最 大 似 然 (maxi- 
mum likelihood, 简称 ML) 方法 来 估计 这 个 模型 . 对 十 AR BLY, OLS 估计 ó, 和 
S; 等 价 于 (条 件 )ML 估计 . 然而 , | 的 估计 之 间 有 所 区 别 . X H ML 估计 为 


$; = D af" aly. (8.19) 
VAR(i) 模型 在 正 态 假定 下 的 AIC 定义 为 
ws 
对 一 个 给 定 的 向 量 时 间 序 列 , 可 以 选择 AR 的 阶 p, 使 它 满足 AIC(p) = min AIC(i), 
其 中 po 是 一 个 预先 指定 的 正 整 数 . 
对 于 VAR(i) 模型 其 他 可 用 的 信息 准则 有 


?i ln(T 
+ intr) 


AIC(i) = In(|2;|) + 


BIC(i) = In(|3.;]) 


HQ(i) = (S + 210007) 

HQ 准则 是 由 Hannan 和 Quinn(1979) 年 提出 的 . 

例 8.4 ”假定 例 8.1 中 讨论 的 由 IBM 股票 和 S & P500 指数 的 月 对 数 收益 率 所 
构成 的 二 元 序列 服从 一 个 VAR 模型 , 我 们 对 数据 利用 M(i) 统计 量 和 AIC. 表 8-3 
给 出 了 这 些 统计 量 的 值 . 两 个 统计 量 都 表明 VAR(3) 模型 对 数据 可 能 是 充分 的 . 在 
SHACK F, M(i) 统计 量 在 延迟 1, 3, 5 处 都 是 边际 显著 的 . AIC 的 最 小 值 在 阶 3 处 
出 现 . 对 这 个 特例 , M(i) 统计 量 在 1% 水 平 下 是 不 显著 的 ， 从 而 证 实 了 前 面 的 观测 : 
两 个 收益 率 序列 之 间 的 动态 序列 相依 性 很 弱 . 


X 8-3 IBM 股票 和 S&P500 指数 的 月 对 数 收 蔓 举 的 定 阶 统计 量 ， 
时 间 区 间 从 1926 年 1 AB) 1999 年 12 H ^ 


阶 1 2 3 4 5 6 
M (i) 9.81 8.93 12.57 6.08 9.56 2.80 
AIC 6.757 6.756 7.750 6.753 6.751 6.756 


a 自由 度 为 4 的 卡 方 分 布 的 5 中 和 LOIS 9.5 和 13.3. 
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估计 和 模型 检验 


对 于 一 个 指定 的 VAR 模型 , 可 以 利用 普通 最 小 二 乘法 或 最 大 似 然 方 法 来 估计 
参数 . 这 两 个 方法 是 渐 近 等 价 的 . 在 一 些 正则 性 条 件 下 , 估计 是 渐 近 正 态 的 . 参见 
Reinsel (1993). 应 该 对 所 拟 合 模型 的 任何 可 能 存在 的 不 充分 性 进行 仔细 检验 . 可 以 
对 残 差 序列 利用 Qu(m) 统计 量 来 检验 残 差 之 间 没 有 序列 相关 或 交叉 -相关 的 假定 . 
对 一 个 拟 合 的 VAR(p) 模型 , 残 差 的 Qk(m) 统计 量 渐 近 服 从 自由 度 为 k?m — g 的 
x? 分 布 , 这 里 9 为 AR 系数 矩阵 中 符 估 参数 的 个 数 . 

例 8.4( 续 ) Æ 8-4a 给 出 了 对 于 IBM 股票 和 S& P500 指数 的 月 对 数 收益 率 所 构 
成 的 二 元 序列 拟 合 VAR(3) 模型 时 的 估计 结果 , 具体 指定 的 模型 以 下 面 的 形式 给 
出 : 

T; = $9 + Pire-1+ OQar; 3 + at, (8.20) 


其 中 r 的 第 一 分 量 表 示 IBM 股票 的 收益 率 . 对 这 个 特例 , 我 们 仅仅 使 用 了 延迟 1 
和 延迟 3 的 AR 系数 和 矩阵, 这 是 因为 数据 之 间 的 弱 序 列 相关 性 , 一般 地 , 当 MO 
统计 量 和 AIC 准则 指定 一 个 VAR(3) 模型 时 , 应 该 使 用 所 有 的 3 个 AR 延迟 . 表 
84b 给 出 了 估计 结果 . 在 该 结果 中 已 经 将 一 些 统计 上 不 显著 的 参数 设置 为 0. 5 
外 , 表 8-4b 给 出 了 所 拟 合 模型 的 残 差 序列 的 Qi(m) 统计 量 值 为 Q2(4) = 18.17, 
Qa(8) = 41.26. 因为 拟 合 的 VAR(3) 模型 在 AR 系数 矩阵 中 具有 4 个 参数 , 所 以 这 
两 个 Qu(m) 统计 量 分 别 渐 近 服 从 自由 度 为 12 和 28 的 分 布 . 检验 的 p 值 分 别 
为 0.111 和 0.051, 因此 在 5% 的 显著 性 水 平 下 , 模型 是 充分 的 . 如 同一 元 分 析 中 显 
示 的 , 收益 率 序列 很 可 能 具有 条 件 异 方差 性 . 我 们 在 第 10 章 中 将 讨论 多 元 波动 率 . 


表 8-4 对 由 IBM 股票 和 标准 普尔 500 指数 的 月 对 数 收益 率 拟 合 VAR.(3) 模型 时 的 估计 
£m. 时间 区 间 从 1926 年 1 月 到 1999 年 12 月 


U.011 
—0.013 
0.043 


23.51 31.29 


—0.083 
0.109 
0.040 
0.033 


23.51 31.29 


从 表 8-4b 中 拟 合 的 模型 , 我 们 观测 到 : (a) 两 个 新 息 序列 之 间 的 同步 相关 系数 
为 23.51/V44.48 x 31.29 = 0.63, 如 所 料想 , 它 很 接近 于 ru 与 roe 之 间 的 样本 相关 
系数 ; (b) 两 个 对 数 收益 率 序列 具有 正 的 显著 的 均值 , 蕴涵 了 了 棒 个 序列 的 对 数 价格 
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在 该 数据 范围 内 具有 上 升 趋势 ; (c) 这 个 模型 表明 
IBM; = 1.24 + 0.117SP5,_1 — 0.083SP5, 3 + ätt, 


SP5, = 0.57 + 0.073SP5,_1 — 0.109SP5, .3 + as. 
因此 在 5% 显著 水 平 下 从 S& P500 指数 的 月 收益 率 到 IBM 的 月 收益 率 有 一 个 单 向 
动态 关系 . WR S& P500 指数 代表 美国 股票 市 场 , 则 IBM 收益 率 将 受 该 市 场 过 去 
运动 的 影响 . 然而 , 即使 两 个 收益 率 有 实质 上 的 同步 相关 性 , IBM 股票 收益 率 的 过 
去 运动 也 并 不 显著 地 影响 美国 股票 市 场 , 最 后 , 拟 合 的 模型 可 以 写 为 


| IBM, | E | 1.24 | , | 0.117 | "TN | 0.083 | ae! | ait h 
SP5: 0.57 0.073 0.109 az 
这 表示 SPH, 是 该 二 元 序列 的 驱动 因子 (driven factor). 
预测 

将 合理 建立 的 模型 看 作 是 真实 的 模型 , 则 可 以 应 用 一 元 分 析 中 同样 的 方法 来 进 
行 预测 并 得 到 相应 预测 误差 的 标准 差 . 对 一 个 VAR(p) 模型 , 以 n 为 预测 原点 的 1 
步 向 前 预测 为 rall) = 内 十 2 Siria i. 相应 的 预测 误差 为 en(1) =ar. 预测 误 
差 的 协 方差 矩阵 为 x. 对 于 向 前 两 步 预测 , 用 ,1 的 预测 来 代替 mí 即 可 得 到 

T4(2) = dy + Pyr,(1) + lona 
es 
相应 的 预测 误差 为 
€n(2) = Gayo + 9i[rr — 4 (1)] = ah+2 十 更 1Qh+1. 

预测 误差 的 协 方差 矩阵 为 4+ ODO). 如 果 or, 是 弱 平 稳 的 , 则 随 着 预测 步 长 1 的 
增加 , 向 前 1 步 预测 rh(1) 将 收 剑 到 均值 向 量 uus 预测 误差 的 协 方差 矩阵 收敛 到 m 
的 协 方差 矩阵 . 

表 8-5 给 出 了 IBM 股票 和 S&P500 指数 月 对 数 收 益 率 (以 百分比 形式 给 出 ) 的 


向 前 一 步 预测 和 向 前 六 步 预测 的 结果 , 预测 原点 为 h= 888. 预测 是 通过 表 8-4 中 
改进 后 的 VAR(3) 模型 得 到 的 . 


R 8-5 ”对 IBM 股票 和 标准 普尔 500 指数 的 月 对 数 收益 率 (以 百分比 形式 给 出 ) 利用 所 
拟 合 的 VAR(3) 模型 进行 预测 的 结果 : 预测 原点 是 1999 年 12 月 


步 长 1 2 3 4 5 6 
IBM 的 预测 值 1.40 1.12 0.82 1.21 1.27 1.31 
标准 差 6.67 6.70 6.70 6.72 6.72 6.72 
S&P 的 预测 值 0.32 0.38 —0.02 0.53 0.56 0.61 


标准 差 5.59 5.61 5.61 5.64 6.64 5.64 
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总 之 , 建立 一 个 VAR 模型 涉及 三 个 步骤 : (a) 利用 检验 统计 量 M (i) 或 某 种 信 
息 准则 定 阶 ; (b) 利用 最 小 二 乘法 估计 指定 的 模型 , 如 有 必要 , 可 以 通过 消除 统计 上 
不 显著 的 参数 来 重新 估计 这 个 模型 ; (c) 利用 残 差 的 Qi (m) 统计 量 来 检验 拟 合 模型 
的 充分 性 . 残 差 序列 的 其 他 特征 , 如 条 件 异 方差 和 异常 值 , 也 可 以 检验 . 如 果 拟 合 
的 模型 是 充分 的 , 则 可 以 用 它 来 进行 预测 并 对 变量 之 间 的 动态 关系 作 推 断 . 

本 小 节 用 SCA 进行 分 析 . 所 用 的 命令 包括 miden, mtsm, most 和 mfore, 其 
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中 前 级 m 表示 多 元 . 下 面 给 出 了 命令 和 输出 结果 的 细节 . 


SCA 演示 


输出 结果 , 其 中 “%7” 表示 注释 . 
input ibm,sp5. file 'm-ibmspln.txt' 

-- % Order selection 
miden ibm,sp5. no ccm. arfits 1 to 6. 


TIME PERIOD ANALYZED . 


SIGN. 


+ HH 


+H A 


SERIES NAME MEAN STD. ERROR 
1 IBM 1.2402 6.7249 
2 SP5 0.5372 5.6415 
=========  STEPWISE AUTOREGRESSION SUMMARY ==== 
T RESIDUAL T EIGENVAL.I CHI-SQ I 
LAG I VARIANCESI OF SIGMA I TEST I AIC 
-~ 一- 十 ~ 一 一 一 一 一 一 一 一 一 +---------- +--------- +--------- 
1 I .447E+02 I .135E+02 I 9.81 I 6.757 
I .318E«02 I .629E«02 I I 
----R---------- 二 一 -一 一 一 一 一 一 一 一 +--------- +--------- 
2 I .443E402 I .135E+02 I 8.93 I 6.756 
I .317E+02 I .625E+02 I I 
---—-R---------- +---------- +--------- 4R--------- 
3 I .441E«02 I .134E«02 I 12.57 I 6.750 
I .313E«02 I .619E«02 I I 
~ 一 一 -十 ~ 一 一 -一 -一 一 -~ +---------- 十 一 一 一 一 一 一 一 一 一 十 一 一 一 一 一 一 一 一 一 
4 T .441E«02 I .133E+02 I 6.08 I 6.753 
I .312E«02 I .619E+02 I I 
T——-4---------- 4---------- 4R--------- +--------- 
5 I .437E+02 I .133E«02 I 9.56 I 6.751 
I .309E+02 I .613E+02 I t 
~ 一 一 ~- 十 ~ 一 一 一 一 一 一 一 一 一 R---------- +--------- 不 一 一 一 一 一 一 一 一 一 
6 I .437E«02 I .133E+02 I 2.80 I 6.756 
I .308E402 I .613E+02 I I 


HH + HH + HH + HH + HH 


二 


CHI-SQUARED CRITICAL VALUES WITH 4 DEGREES OF FREEDOM 


mtsm fitl. 


5 PERCENT: 


series ibm, 


sp5 


9.5 


. @ 


1 PERCENT: 
-- $ Specify a VAR(3) model with lags 1 & 3 only. 


model (i-pl*b-p3*b**3)series-c«noise. 


13.3 


888 
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SUMMARY FOR MULTIVARIATE ARMA MODEL -- FITL 
PARAMETER FACTOR ORDER CONSTRAINT 
1 C CONSTANT 0 CC 
2 P1 REG AR 1 CP1 
3 P3 REG AR 3 CP3 


-- 5 Perform multivariate estimation 
mestim fitl. hold resi(ri,r2) 
----- CONSTANT VECTOR (STD ERROR) ----- 
2.201 { O.232 ) 
0.583 ( 0.194 ) 
----- PHI MATRICES ----- 
ESTIMATES OF PHI(1) MATRIX AND SIGNIFICANCE 


.011 - 108 . + 
-.013 .084 
STANDARD ERRORS 
.043 .051 
.036 .043 
ESTIMATES OF PHI(3) MATRIX AND SIGNIFICANCE 
.039 *4112 Rim 
-.007 -.105 5 = 
STANDARD ERRORS 
.044 .052 
037 044 


一 一 一 一 


1 2 
1 44.438125 
2 23.518578 31.287280 
-~ $ Set parameter to 0 
pi (i; 1)=0 
pl (2,1)=0 
-- % Set constraint to fix the parameter 
cp1(1,1)=1 
cp1(2,1)=1 
p3 (1, 1)=0 
ep3(1,1)=1 
cp3 (2,1)=1 


mestim fitl. hold resi(ri,r2). 
----- CONSTANT VECTOR (STD ERROR) ----- 
1.243 ( 0.226 ) 
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0.566 ( 0.190 ) 
----- PHI MATRICES ----- 
ESTIMATES OF PHI(1) MATRIX AND SIGNIFICANCE 


.000 PP a E 
.000 .073 
STANDARD ERRORS 
-> -040 
-- .033 
ESTIMATES OF PHI(3) MATRIX AND SIGNIFICANCE 
.000 -.083 x = 
.000 24109 DS 
STANDARD ERRORS 
== -040 
=H .033 


ERROR COVARIANCE MATRIX 


il 14.482888 
2 23.506951 31.293592 
-- $ Compute residual CCM 
miden r1,r2. maxl 12. 
-- & Produce 1 to 6-step ahead forecasts 
mfore fitl. nofs 6. 


8.2.5 ”脉冲 响应 函数 
类 似 于 一 元 情形 , 一 个 VAR(p) 模型 可 以 表示 为 过 去 新 息 的 线性 函数 , BI 
T, = p+ a4 + Piai + Patat, (8.21) 


其 中 , j = [e(1)]-!ó,, 这 里 假定 更 (1) 的 逆 存 在 , 系数 矩阵 v; 可 以 由 与 下 式 中 B' 
的 系数 相等 得 到 : 


(I—91B-—-.—9,D")(I + ViB-- VjB? +) =I, 


其 中 7 为 单位 矩阵 . 这 是 nv 的 滑动 平均 表示 , 其 中 系数 矩阵 更; AMER a 
对 or, 的 影响 . 等 价 地 , V, 也 是 a, 对 未 来 观测 re 的 影响 . 因此 通常 称 更 ; Ar, 
的 脉冲 响应 函数 . 然而 , 由 于 a 的 分 量 通常 是 相关 的 , 所 以 对 (8.21) 式 中 V; 分 
量 的 解释 不 是 很 直观 . 为 了 帮助 解释 , 我 们 可 利用 前 面 的 Cholesky 分 解 对 新 息 进 
行 变换 , 使 得 变换 后 的 新 息 的 分 量 不 再 相关 . 具体 地 , 存在 一 个 下 三 角 和 矩阵 L 满 
fi» = LEGEL, 其 中 G 为 对 角 阵 且 五 的 对 角 线 元 素 均 为 1( 参 见 (8.9) Å). + 
b, = L'a, 则 Cov(b,) = G, 因此 分 量 b;, 是 不 相关 的 . (8.21) 式 可 以 改写 为 


Tt 二 人 二 + at + Piati 十 于 2Qt-2 十 *…: 
=p+ LL a, + PLL ay + VLL a 2 4: 
= pu + Nob, + Bib a Vjb,oc:e. (8.22) 
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其 中 pi = L, V} = UL. 系数 矩阵 V7 称 为 re 的 带 正 交 新 息 b, 的 脉冲 响应 函数 . 
特别 地 , Wy 的 第 (i,j) 76 WT) 是 by 对 未 来 观测 nis 的 影响 . 在 实际 中 , 可 以 进 
一 步 将 正 交 的 新 息 b, 标准 化 , 使 得 b, 的 方差 为 1. 上述 正 交 化 的 一 个 弱点 是 结果 
依赖 于 T 中 分 量 的 顺序 . 特别 地 ， bi, = ait, 从 而 Q1, 并 没有 作 变 换 . Tt 分 量 的 不 同 
排序 会 导致 不 同 的 脉冲 响应 函数 . 

SCA 和 S-Plus 都 可 以 得 到 所 拟 合 VAR 模 型 的 脉冲 响应 函数 . 为 了 演示 S-Plus 
中 VAR 模 型 的 分 析 , 我 们 仍然 用 例 8.1 中 IBM 股票 和 S&P500 指数 的 月 对 数 收益 
率 的 数据 . 关于 S-Plus 命令 的 细节 , 可 参见 Zivot 和 Wang(2003). 


S-Plus 演示 


输出 结果 . 
> x-matrix(scan(file-'m-ibmspln.txt'),2) % Load data 
> ibmsx[1,] 
> sp5=x[2,] 
> y=cbind (ibm, sp5) % Create a vector series 
> yl=data.frame(y) % create a data frame 
> ord.choice=VAR (y1,max.ar=6) % order selection 
> ord.choice$info 


ar (1) ar (2) ar (3) ar (4) ar(5) ar(6) 
BIC 10998.47 11016.61 11031.07 11052.05 11069.49 11093.78 
> ord.choice-VAR(yl,max.ar-6,criterion-'AIC') 
> ord.choice$info 

ar (1) ar (2) ar (3) ar (4) ar (5) ar (6) 
AIC 10969.78 10968.79 10964.11 10965.97 10964.28 10969.44 


AIC 跟 以 前 一 样 选择 了 VAR(3) 模型 , 而 BIC 选择 了 VAR(1) 模型 . 为 简单 起 
JL, 我 们 在 演示 中 用 VAR(1) 模型 . 注意 到 在 两 个 程序 包 中 用 到 了 不 同 的 标准 化 方 
法 , 因此 信息 准则 的 值 是 不 同 的 , 可 参见 表 8-3 中 的 AIC. 这 并 不 重要 , 因为 标准 化 
并 不 影响 阶 的 选择 , 下 面 转向 估计 . 


> varl.fit=VAR(y~ar(1)) % Estimation 
> summary (varl .fit) 


Call: 
VAR (formula = y ~ ar(1)) 
Coefficients: 

ibm sp5 


(Intercept) 1.1627 0.4993 
(std.err) .2290 0.1925 
(t.stat) .0777 2.5935 


uo 


ibm.lagl 0.0192 -0.0054 
(std.err) 0.0433 0.0364 


(t.stat) 0.4429 -0.1487 
sp5.lagl 0.1062 0.0802 
(std.err) 0.0517 0.0435 
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(t.stat) 2.0544 1.8454 
Regression Diagnostics: 
ibm sp5 
R-squared 0.0105 0.0058 
Adj. R-squared 0.0082 0.0036 
Resid, Scale 6.7043 5.6376 


> plot (varl .fit) 

Make a plot selection (or 0 to exit): 
1: plot: All 

2: plot: Response and Pitted Values 
3: plot: Residuals 


8: plot: PACF of Squared Residuals 
Selection: 3 


所 拟 合 的 模型 是 
IBM, = 1.1.6 + 0.02IBM,.., + 0.11SP5;_1 十 mit， 


SP5, = 0.50  0.01TIBM;—; | 0.08SP5,-1 + azt- 


基于 输出 结果 中 估计 的 t 统计 量 的 值 , 在 两 个 方程 中 都 只 有 延迟 变量 SP51 是 显 
著 的 . 图 8-5 给 出 了 两 个 残 差 序列 的 时 间 序 列 图 , 两 条 水 平 线 表示 两 倍 的 标准 误差 
EFR. 如 所 料想 , 取 值 为 异常 值 的 观测 存在 聚集 现象 . 

残 差 与 时 间 
0 200 400 600 


a a 


800 


ü 200 400 600 800 


图 8-5 A IBM 股票 和 S&P500 指数 的 月 对 数 收益 率 (以 百分比 形式 给 出 ) 所 拟 合 的 VAR(1) 
模型 残 差 的 时 间 序 列 图 , 样本 的 时 间 区 问 从 1926 年 1 月 到 1999 年 12 月 


接 下 来 , 我 们 计算 所 拟 合 VAR(1) 模型 的 向 前 1 步 到 向 前 6 步 预测 以 及 脉冲 
响应 函数 , 这 里 BM 股票 的 收益 率 是 or, 的 第 一 个 分 量 . 与 表 8-5 中 的 VAR(3) 模 
型 相 比 , 用 VAR(1) 模型 得 到 的 预测 更 快 地 收敛 到 序列 的 样本 均值 . 
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> varl.pred=predict (varl.fit,n.predict=6) % Compute prediction 
> summary (vari .pred) 
Predicted Values with Standard Errors: 
ibm sp5 
1-step-ahead 1.8472 0.9255 
(std.err) 6.7043 5.6376 
2-step-ahead 1.2964 0.5636 
(std.err) 6.7394 5.6539 
3-step-ahead 1.2474 0.5375 
(std.err) 6.7397 5.6540 


6-step-ahead 1.2434 0.5356 
(std.err) 6.7397 5.6540 
> plot(varl.pred,y, n.old-12) $% Plot forecasts 
> varl.irf=impRes (varl.fit,period-6,std.err=’ asymptotic’ ) 
> summary (varl.irf) 
Impulse Response Function: 


(with responses in rows, and innovations in columns) 


sa 18g: 
ibm sp5 
ibm 6.6929 0.0000 
(std.err) 0.1589 0.0000 
sp5 3.5645 4.3553 
(std.err) 0.1690 0.1034 
so. aged 
ibm sp5 
ibm 0.5069 0.4624 
(std.err) 0.2244 0.2249 
sp5 0.2496 0.3492 
(std.err) 0.1885 0.1891 


» plot(varl.irf) 


图 8-6 给 出 了 最 后 12 个 数据 点 的 点 预测 和 置信 水 平 为 95% 的 预测 区 问 ， 图 
8-7 给 出 了 所 拟 合 VAR(1) 模型 脉冲 响应 的 函数 图 , 这 里 IBM 股票 的 收益 率 是 r 
的 第 一 个 分 量 . 由 于 收益 率 序列 的 动态 相依 性 很 弱 , 从 而 脉冲 响应 函数 展现 出 简单 
的 形式 , 并 且 快 速 地 衰减 . 
8.3 ” 回 量 滑动 平均 模型 
一 个 阶 为 4 的 向 量 滑动 平均 模型 (VMA(q) 模型 ) 具有 形式 


r, = ĝo + a, — Oraii —---— O,a,. 或 re = 0o + O(B)at, (8.23) 


其 中 Oo 是 大 维 向 量 , O; Æ k x k HERE, O(B) - I- GB ----— evB9 是 向 后 推 
移 算 子 B 的 MA 和 矩阵 多 项 式 . 类 似 于 一 元 的 情形 , 假定 a. 的 协 方差 矩阵 Y: 存在 ， 
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MW VMA(q) 过 程 是 弱 平 稳 的 . 将 (8.23) 式 取 期 望 , 得 到 pp — Elri) = Oo. 这 样 , 对 
VMA 模型 而 言 , 常数 向 量 go 是 r, 的 均值 向 量 . 


880 885 890 


880 885 890 


指数 
图 8-6 ”利用 为 IBM 股票 和 3&P500 指数 的 月 对 数 收 益 率 (以 百分比 形式 给 出 ) 所 拟 合 的 
VAR(1) 模型 进行 预测 的 预测 图 , 样本 的 时 间 区 间 从 1926 年 1 月 到 1999 年 12 月 


eo eee anm 


0 1 2 3 4 5 


Bk opus v 


PST (£X ^i 1 el 
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步 数 
图 8-7 为 [BM 股票 和 S&P500 指数 的 月 对 数 收 益 率 (以 百分比 形式 给 出 ) 所 拟 合 的 
VAR(1) 模型 的 正 交 新 息 的 脉冲 响应 函数 图 , 样本 的 时 间 区 间 从 1926 年 1 月 
到 1999 年 12 A 
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4 fi = ri — 00 为 均值 修正 的 VAR(g) 过 程 . 那么 利用 (8.23) 式 以 及 {a,} 是 
序列 不 相关 的 事实 , 我 们 有 : 

(1) Cov(r;, a,) = X; 

(2) To — £+ 0:120; +--+ 9,€X6;; 

(3) 4 1> q, Jl] T, = 0; 

(4) 4$ 1«1« q, ll T; — 1: 6,26! ,, X Oy — I. 


F 
因为 对 于 1 >q, A T; = 0, 所 以 VMA (q) 过 程 r: 的 交叉 -相关 矩阵 (CCM) 满足 
p,—^9, I>q. (8.24) 


因此 , 类 似 于 一 元 情形 , 可 以 利用 样本 CCM 来 识别 一 个 VMA 过 程 的 阶 . 
为 了 更 好 地 理解 VMA 过 程 , 让 我 们 考虑 二 元 MA(1) 模型 . 


Ti = 09 + a; — Oa; = pa, — Oat, (8.25) 


这 里 为 了 简便 , 消除 了 € 的 下 标 . 这 个 模型 可 以 清楚 地 写 为 


Mt Ita ait Oi; Ais G1,4—1 
| rae | E | He | Y | Azt | | O21 02 | Q2it 一 1 | í vinis 

它 说 明 当 前 的 收益 率 r 仅仅 依赖 于 当前 的 和 过 去 的 扰动 . 因此 , 这 个 模型 是 一 个 
有 限 记忆 模型 . 

考虑 (8.26) RP ru 所 满足 的 方程 , 参数 Ore 表示 aye 存在 时 , ri 对 azt 
的 线性 依赖 . 如 果 Oi = 0, W ru 并 不 依赖 于 ax 的 延迟 值 , 因此 也 不 依赖 于 rz 
的 延迟 值 . 类 似 地 , 如 果 621 = 0, WA rz 并 不 依赖 于 re 的 过 去 值 . © 的 非 对 角 
元 素 反 映 了 分 量 序列 之 间 的 动态 依赖 性 . 对 这 个 简单 的 VMA(1) 模型 , 我 们 可 以 将 
Tit 与 T2t 之 间 的 关系 分 类 如 下 . 

(1) 如 果 On = Oa — 0, 则 它们 是 分 离 的 序列 . 

(2) WR On = 0 , On £0, WA ru 到 re 有 一 个 单 向 动态 关系 . 如 果 
92; = 0, 但 O12 40, 则 相反 的 单 向 动态 关系 成 立 , 

(3) ty 815 * 0, HR. O21 x 0, 则 Tit 与 T2t 之 间 有 一 个 反馈 关系 . 

最 后 , re 之 间 的 同步 关系 与 au. 之 间 的 同步 关系 是 一 样 的 . 前 面 的 分 类 可 以 推 
广 到 VMA(q) 模型 . 
估计 

与 VAR 模型 不 同 , VMA 模型 的 估计 更 加 复杂 . 具体 可 参见 Hillmer 和 Tiao 
(1979) 与 Lütkepohl (1991) 及 其 参考 文献 ， 对 似 然 近 似 法 , 有 两 种 方法 可 以 利用 . 
第 一 种 方法 是 条 件 似 然 方法 , 它 假定 对 于 + 和 0, 有 a, = 0. 第 二 种 方法 是 精确 似 然 
方法 , 它 将 上 和 0 时 的 at 看 作 模 型 的 一 个 附加 参数 . 为 了 获得 估计 问题 的 一 些 洞 
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察 , 我 们 考虑 (8.25) 式 中 的 VMA(1) 模型 . 假定 数据 为 (rit — 1, , T), Ha, Æ 
多 元 正 态 的 . 对 一 个 VMA(1) 模型 , 这 个 数据 依赖 于 ao. 
条 件 MLE 
条 件 似 然 方法 假定 ao = 0. 在 这 个 假定 下 , 将 模型 改写 为 at — r; 09 9a; )， 
我 们 可 以 递 推 地 计算 ar, 有 
a; = Tı — Oo, a2 = T2 — 0o + Ojai, e. 


因此 , 数据 的 似 然 函 数 变 为 


T 
fí(ri,-:-,r7]00,0,, 5) = II Gym [| 
并 据 此 得 到 参数 估计 . 
精确 MLE 
对 精确 似 然 方法 , ao 是 一 个 未 知 向 量 , 为 了 计算 似 然 函数 , 必须 根据 数据 进行 
估计 , 为 了 简便 , Sr. = rt — 09 为 均值 修正 序列 . 利用 i 与 (8.25) R, 我 们 有 
a, = T, + Oai. (8.27) 
通过 重复 迭代 , ao 与 所 有 的 n, 都 相关 , 因为 
al =T; + Gap, 
ag — T3 + Qa, =7a 十 Fr 十 昌 zao， (8.28) 


ap =fr+Or7_,+---+07 PF, 9" as. 


这 样 如 果 给 定 日 和 Oo , 则 ao 是 数据 的 线性 函数 . 这 个 结果 使 得 我 们 可 以 利用 数 
据 与 Go 以 及 © 的 初始 值 来 估计 ao. 更 具体 地 , 给 定 09, 6 与 数据 , 我 们 可 以 定 
X: 

ri = + Oa t OT, t-12,-.,T. 
则 (8.28) 式 可 以 改写 为 


rj = —Oay + ay, 

* 2 
T, = —O"a, + a2, 
ry = -9T'a,-r ar. 


这 是 多 元 线性 回归 的 形式 , 参数 向 量 为 ao, 尽管 ar 的 自 协 差 矩阵 D 可 能 个 是 一 个 
对 角 阵 . 如 果 x 的 初始 值 也 可 以 得 到 , 则 可 以 用 X: 的 平方 根 矩阵 区? 左 乘 上 面 
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系统 中 的 每 个 方程 . 结果 中 的 系统 真 的 是 一 个 多 元 线性 问 归 , 且 可 以 利用 OLS Jj 
法 来 得 到 ay 的 一 个 估计 ， 表示 为 ao. 
利用 估计 âo, 可 以 递 推 地 计算 扰动 at, 因为 


al 一 71 一 00 十 日 a0， a2=7T2—-89+O0a\,---. 


该 递 推 是 从 (ao, mi. arr) 到 (aolai, ,ar) 的 线性 变换 . 我 们 可 以 从 中 得 到 ay 
和 数据 的 联合 分 布 . 另外 , 我 们 也 可 以 从 {arlt = 0,--- , 7) 的 联合 分 布 中 通过 求 ay 
的 积分 来 推出 数据 的 精确 似 然 函数 . 可 以 利用 如 此 求 得 的 似 然 函 数 来 得 到 精确 的 
ML 估计 . 具体 细节 参见 Hilmer 和 Tiao(1979). 

总 之 , 精确 似 然 方法 的 操作 如 下 : 给 定 6o, © 与 x 的 初始 估计 , 利用 (8.28) xt 
导出 ao 的 估计 . 利用 (8.27) 式 , 这 个 估计 又 反 过 来 可 以 用 来 递 推 地 计算 a, 且 初 始 
(iA a, = T1 + Cao, 然后 利用 结果 中 的 {a hy_， 估计 数据 的 精确 似 然 函数 , 以便 
更 新 00,0 ME 的 估计 . 重复 整个 过 程 直 全 估计 收敛 . 估计 精确 似 然 函 数 的 这 个 
友 代 方法 对 一 般 的 VMA(g) 模型 也 是 适用 的 . 

由 前 面 的 讨论 知 , 精确 似 然 方法 比 条 件 似 然 方法 要 求 更 多 精深 的 计算 . 但 是 它 
也 提供 了 更 精确 的 参数 估计 , 尤其 是 当 e 的 某 些 特征 值 的 模 接近 于 1 时 . Hillmer 
和 Tiao(1979) 给 出 了 VMA 模型 的 条 件 似 然 估 计 与 精确 似 然 估计 之 间 的 一 些 比较 . 
在 多 元 时 间 序 列 分 析 中 , 如 果 怀 疑 数据 可 能 过 度 差分 , 则 精确 最 大 似 然 方法 变 得 万 
其 重要 . 过 度 差分 可 能 在 很 多 情况 下 发 生 , 例如 , 协 整 系统 中 单个 分 量 的 差分 (参见 
后 面 对 协 整 的 讨论 ). 

总 之 , 建立 一 个 VMA 模型 需要 三 个 步骤 : (a) 利用 样本 交叉 -相关 和 矩阵 识别 阶 
4 (因为 , 对 VMA(g) 模型 , 当 1 >q 时 , o, = 0); (b) 利用 条 件 似 然 方法 或 精确 似 然 
方法 来 估计 指定 的 模型 ( 当 样 本 量 不 太 大 时 , 更 喜欢 用 精确 方法 ); (c) 应 该 检验 所 
拟 合 模型 的 充分 性 (例如 对 残 差 序列 利用 Qi (mm) 统计 量 ). 最 后 , 可 以 利用 与 一 元 
MA 模型 同样 的 程序 得 到 VMA 模型 的 预测 . 

例 8.5 再 次 考虑 由 IBM 股票 和 S& P 500 指数 的 月 对 数 收 益 率 (以 百分比 表示 ) 
所 构成 的 二 元 序列 , 时 间 区 间 从 1926 年 1 月 到 1999 年 12 H. 因为 显著 的 交叉 _ 相 
关 主 要 在 延迟 1 和 延迟 3 处 发 生 , 所 以 我 们 对 数据 采用 了 下 述 VMA(3) 模型 


r= 0, + Aa, — Oia I Qaa, 3. (8.29) 


表 8-6 给 出 了 这 个 模型 的 估计 结果 . 这 个 简化 模型 残 差 的 Qi(m) 统计 量 值 为 Q2(4) = 
17.25, Qo(8) = 39.30. 与 自由 度 为 12 和 28 的 x? 分 布 比较 , 这 些 估 计量 的 p 值 分 
AE 0.140 4 和 0.076 2. 因此 , 该 模型 在 5% 的 显著 水 平 下 是 充分 的 . 

由 表 8-6, 我 们 作出 以 下 观测 . 

(1) 对 这 个 特例 , 条 件 似 然 估 计 与 精确 似 然 估计 的 差别 很 小 . 这 并 不 奇怪 , 因为 
样本 量 并 不 小 , 而 且 更 重要 的 是 数据 的 动态 结构 很 弱 . 
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X 8-6 Xİ IBM 股票 和 S&P500 指数 的 月 对 数 收益 率 拟 合 向 量 滑动 平均 模型 (8.27) 时 
的 估计 结果 (时 间 区 间 是 从 1926 年 1 月 到 1999 年 12 月 ) 
s& |o] io | Ə x 


(a) 整个 模型 , 用 条 件 似 然 方 法 


一 0.038 
0.014 
0.044 
0.036 
(b) 整个 模型 , 用 精确 似 然 方法 

—0.038 0.108 
0.013 0.105 
0.044 0.052 
0.036 0.043 


0.108 
0.105 
0.052 
0.043 


23.52 31.20 


(c) 简化 的 模型 , 用 精确 似 然 方法 


0.000 
U.000 


—0.126 
一 0.084 
0.040 
0.033 = 0.033 


0.000 
0.000 


23.51 31.21 


(2) VMA (3) 模型 对 序列 提供 了 与 例 8.4 的 VAR(3) 模型 同样 的 动态 关系 . IBM 
股票 的 月 收益 率 依赖 S& P 500 指数 过 去 的 收益 率 . 相反 地 , 市 场 收 益 率 并 不 依赖 
于 IBM 股票 的 过 去 收益 率 . 换 句 话说 , 数据 的 动态 结构 是 由 市 场 收 益 率 而 并 不 是 
IBM 收益 率 驱 动 的 , 然而 , 两 个 收益 率 序列 间 的 同步 相关 性 仍 很 强 . 


8.4 向 量 ARMA 模型 


一 元 ARMA 模型 也 可 以 推广 到 处 理 向 量 时 间 序 列 的 情形 ， 所 得 的 模型 称 为 
VARMA 模型 . 然而 , 这 种 推广 会 遇 到 一 些 在 VMA 和 VAR 模型 时 不 会 出 现 的 新 
问题 . 其 中 一 个 问题 是 识别 问题 . 与 一 元 ARMA 模型 不 同 , VARMA 模型 并 不 是 唯 
一 定义 的 . 例如 , VMA(1) 模型 


rit |_| Ge | _ 0 2 01,t—1 
Tat 2t 0 0 d2.1—1 
re | [9 = Ti4-1 | _ | 41 
Tot 0 0 T2,t—1 2t 


是 相同 的 .这 两 个 模型 的 等 价 性 可 以 通过 检查 它们 的 分 量 模型 很 容易 地 看 出 . 对 
VMA(1) 模型 , 我 们 有 


与 VAR(1) 模型 


Pie = are — 2ag4-1, Tot 一 CQ2f。 


对 这 个 VAR(1) 模型 , 方程 为 
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Ti + 2 


由 ro, 所 服从 的 模型 , 我 们 有 roti = aze. 因此 mt 所 服从 的 模型 是 相同 的 . 这 
种 类 型 的 识别 问题 并 没有 坏处 , 因为 在 实际 应 用 中 , 两 个 模型 都 可 以 使 用 . 
男 一 种 类 型 的 识别 问题 比较 麻烦 . 考虑 VARMA(1,1) 模型 


Tit g 0.8 —2 Citi = Ait = —0:5 Q0 A141 
roe 0 0 T2.4—1 an 0 0 2.4—1 


Lj VARMA(1,1) 模型 


eie » ul bmi" a es 
T2 0 Ww T24—1 ic a2: 0 w agii | 
这 两 个 模型 对 任何 非 零 的 w 和 7 是 相同 的 . 在 这 个 特例 中 , 等 价 性 之 所 以 成 立 是 
内 为 在 两 个 模型 中 都 有 ru = azt. 在 第 二 个 模型 中 , 参数 w 和 7 对 系统 的 AR 部 
分 和 MA 部 分 的 影响 互相 抵消 了 . 这 一 个 识别 问题 是 严重 的 , 因为 , 如 果 没 有 恰当 
的 限制 , 数据 的 向 量 ARMA(1,1) 模型 的 似 然 函数 并 不 是 唯一 定义 的 , 从 而 导致 了 
类 似 于 回归 分 析 中 的 精确 多 重 共 线 性 的 问题 . 即使 没有 一 个 分 量 是 白 噪 声 序列 , 这 
种 类 型 的 识别 问题 也 会 发 生 . 

这 两 个 例子 引出 了 推广 到 VARMA 模型 时 涉及 的 新 间 题 . 这 样 , 对 一 个 给 定 的 
数据 集合 建立 VARMA 模型 要 求 注意 一 些 问题 . 许多 时 间 序 列 的 文献 , 已 经 提出 
了 用 结构 指定 (structural specification) 方法 来 克服 这 种 识别 问题 . 可 参见 Tiao 和 
Tsay(1989). Tsay (1991) 及 其 参考 文献 . 我 们 这 里 并 不 讨论 结构 指定 的 细节 , 因为 
在 大 多 数 金融 应 用 中 , VAR 和 VMA 模型 就 足够 了 , 当 使 用 VARMA 模型 时 , 只 关 
心 低 阶 的 模型 (如 VARMA(1,1) 或 VARMA(2,1) 模型 ), 尤其 是 当 涉 及 到 的 时 间 序 
列 是 非 季 节 性 模型 时 . 

VARMA (p, q) 模型 可 以 写成 


$(B)r, = po + O(B)ar, 


其 中 &(B) 1—9,B—--—9,B" 和 日 (B) = 1- ©, B--.-—@, BY BBA kxk 
矩阵 多 项 式 . BATTER EES RRA AAAS, 否则 模型 可 以 简化 .r， 
弱 平 稳 的 充 要 条 件 与 具有 矩阵 多 项 式 (B) 的 VAR(p) 模型 是 相同 的 . 对 v > 0, A 
BUERE 更 ， 和 O, 的 第 (i,j) 个 元 素 度量 的 分 别 是 ru 对 rj;,_, así s 的 线性 依 
Wi. 如 果 对 所 有 的 AR 和 MA 系数 矩阵 , 都 有 第 (ij) 个 元 素 为 0, 则 re 并 不 依赖 
Tora 的 延迟 值 . 然而 , 在 VARMA 模型 中 反 过 来 并 不 成 立 . 换 句 话说 , 即使 rt 并 
不 依赖 于 rjt 的 任何 延迟 值 , AR 和 MA 矩阵 的 第 (i,j) 个 位 置 也 可 以 存在 非 0 系 
A. 

为 了 说 明 上 述 问 题 , 考虑 下 面 的 二 元 模型 
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$1,(B) ®ı2(B) | rit | _ | On(B) QQ12(B) | i2 | 
$4,(B) $»(B) T5, Əz (B) ©22(B) (21 
这 里 从 ru 到 ro, 存在 单 向 动态 关系 的 充 要 条 件 是 
$55(B)812(B) — 12(B)Ə22(B) = 0, 


但 是 
ıı (B)Ə21 (B) 一 $51(B)O,1(B) fp 0. (8.30) 
这 些 条 件 可 以 如 下 得 到 , 令 


Q(B) = |$(B)| = $11 (B)d22(B) — B12( B) (B) 


5 P22(B) —9415(B) TET - 
; , 可 以 将 这 个 二 
为 AR 和 矩阵 多 项 式 的 行列 式 , 将 模型 左 乘 Bn(B)  9u(B) | 可 以 将 这 了 
元 模型 改写 为 


$o0(B)O011(B) — 9$12(B)O21(B) 9$22(B)O12(B) — 9$12(B)O22(B) “it 
®);(B)O21(B) — 4(B)On(B) 9$)1(B)023»(B) — 93(B)O12(B) 


考虑 mi 的 方程 ，(8.30) 式 的 第 一 个 条 件 表示 ru 并 不 依赖 于 az 或 ra 的 任何 过 
K. roe 的 方程 , (8.30) 式 的 第 二 个 条 件 隐 含 了 roe 确实 依赖 于 a 的 某 些 过 去 
值 . 根据 (8.30) XX, O12(B) = B12(B) = 0 ÆA ru 到 ra 存在 单 向 关系 的 充分 但 不 
必要 条 件 . 

VARMA 模型 的 估计 可 以 通过 条 件 最 大 似 然 或 精确 最 大 似 然 方 法 来 实现 .对 
拟 合 模型 的 残 差 序 列 , Qim) 估计 量 仍 然 适 用 , 但 是 它 的 渐 近 x? 分 布 的 自由 度 为 
k?m 一 g, 其 中 9 是 MA 和 AR KAGE PHEASANT. 
例 8.6 为 了 说 明 VARMA 的 建 模 , 我 们 考虑 美国 的 两 个 月 利率 序列 . 第 一 个 序列 
是 期 限 为 1 年 的 国库 券 利率 ; 第 二 个 序列 是 期 限 为 3 年 的 国库 券 利率 . 数据 来 自 于 
X. 路 易 斯 联邦 储备 银行 , 样本 区 间 是 从 1953 Æ 4 月 至 2001 年 1 H, 共 574 个 观 
BUE. 为 了 确保 美国 利率 为 正 , 我 们 分 析 对 数 序 列 . 图 8-8 表明 了 两 个 对 数 利率 序 
列 的 时 间 图 . 实 线 表 示 1 年 期 利率 . 这 两 个 序列 在 样本 期 间 内 的 运动 非常 接近 . 

M(i) 统计 量 和 AIC 准则 对 数据 指定 了 一 个 VAR(4) 模型 . 然而 , 我 们 采用 了 
一 个 VARMA(2,1) 模型 , 因为 这 两 个 模型 提供 了 类 似 的 拟 合 . 表 8-7 给 出 了 由 精确 
似 然 方法 得 到 的 VARMA(2,1) 模型 的 参数 估计 . 我 们 去 掉 了 不 显著 的 参数 并 且 重 
新 估计 了 简化 的 模型 . 所 拟 合 模型 的 残 差 序列 共有 轻微 的 序列 相关 且 在 延迟 7 和 
延迟 11 处 有 交叉 相关 性 . 图 8-9 给 出 了 残 差 图 , 从 图 中 可 见 存在 一 些 异 常数 据点 . 
模型 可 以 进一步 改善 , 但 是 它 看 上 去 已 经 很 好 地 刻画 了 数据 的 动态 结构 . 
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1960 1970 1980 1990 2000 


图 8-8 从 1953 年 4 月 到 2001 年 1 月 美国 月 利率 对 数 的 时 间 图 , 实 线 为 1 年 期 的 国库 券 的 
月 利率 的 对 数 , 虚线 则 对 应 3 年 期 


表 8-7 ”基于 精确 似 然 方法 对 美国 的 两 个 月 利率 序列 拟 合 VARMA(2,1) 模型 时 的 参数 估计 


Parameter 


3.58 2.50 
2.50 2.19 


Estimate 


Standard error 


(a) 1 年 期 利率 的 残 差 


1960 1970 1980 1990 2000 


年 
(b) 3 年 期 利率 的 残 差 


x 0.0 


—(0.1 


1960 1970 1980 1990 2000 


年 
图 8-9 例 8.6 中 美国 的 两 个 月 利率 对 数 的 残 差 图 . 所 拟 合 模型 为 VARMA(2,1) 模型 


最 后 的 VARMA(2, 1) 模型 表明 数据 具有 一 些 有 趣 的 特征 . 第 一 , 利率 序列 是 
高 度 同 步 相 关 的 . 同步 相关 系数 为 2.5/V3. 绍 x 23.19 = 0.893. 第 二 , 从 3 年 期 利率 
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到 1 年 期 利率 存在 单 向 线性 关系 , 因为 所 有 AR 和 MA ERE (2,1) 个 元 素 都 
为 0, 但 某 些 第 (1,2) 个 元 素 不 是 0. 事实 上 , 表 8-7 中 的 模型 说 明 ， 


T3; — 0.025 + 0.99rg ¢—1 + agt 十 0.47a3 4-1, 
r1; — 0.028 + 1.821,41 — 0.84r41. (4.2 一 0.977341 + 0.9874 1.5 


rag, — 0.9083 4-1 + 1.6603 4-1, 


其 中 ry, 为 i 年 期 利率 的 对 数 序列 , au 为 相应 的 扰动 序列 . 因此 , 3 年 期 利率 并 不 
依赖 于 1 年 期 利率 的 过 去 值 , 但 是 1 年 期 利率 依赖 于 3 年 期 利率 的 过 去 值 . 第 三 ， 
这 两 个 利率 序列 看 上 去 似乎 是 单位 根 非 平稳 的 , 利用 向 后 推移 算 子 B, 模型 可 以 近 
似 改写 为 
(1— B)ra, = 0.03 + (1 + 0.47B)azp, 

(1 — B)(1 — 0.82B)ri, = 0.08 — 0.97B(1 — B)ra + (1 — 0.9B)ay + 1.66Ba3;. 
分 量 的 边际 模型 

给 定 ri 的 一 个 向 量 模型 , 隐 含 的 组 成 部 分 ri 的 一 元 模型 就 是 边际 模型 (mar- 
ginal models). 对 一 个 天 元 ARM A(p, q) 模型 , 边际 模型 是 ARM Alkp, (k —1)p+ q]. 
这 个 结果 可 以 通过 两 步 得 到 . 第 一 步 , VMA(g) 的 边际 模型 是 一 元 M A(Q). 假定 ri 
是 一 个 VMA(q) 过 程 . 因为 re 的 交叉 相关 -矩阵 在 延迟 q 步 截 尾 (MM 1 > g, 有 
p, = 0), ra 的 ACF 在 超出 延迟 q 后 是 0. 因此 , re 是 一 个 MA 过 程 , 并 且 它 的 一 
元 模型 具有 形式 rà 一 bio + Y 6,jboi-5 这 里 {bic} 是 不 相关 的 随机 变量 序列 , 均 

j=1 

值 为 0, 方差 为 op 参数 6;; 和 cu, 是 ri 的 VMA RBBB eh A. 


第 二 步 要 得 到 的 结果 是 对 角 化 VARMA(p, q) 模型 的 AR 矩阵 多 项 式 . 为 了 更 
好 地 说 明 , 考虑 二 元 AR(1) 模型 


| 1—),(B) —)2(B) | | Tit | E | ait 
—93,((B) 1— P22(B) T2t ax | 


1- $22(B) 915(B) 
21 (B) 1 — ğı (B) 


Tit c 1 — Paal B) ial B) 0434 
ra] $3,(B) 1 — 94(B) ax | 
前 面 方程 的 左边 表明 n 的 一 元 AR 多项式 是 2 阶 的 , 而 方程 的 右面 有 具有 VMA(1) 


的 形式 . 利用 第 一 步 中 VMA 模型 的 结果 , 我 们 证 明了 ra 的 一 元 模型 是 ARMA(2,1) 
的 . 这 个 方法 很 容易 推广 到 开元 VAR(1) 模型 , 其 边际 模型 为 ARMA(k, k — 1). 更 


EREM | , 得 到 
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一 般 地 , 对 一 个 天元 VAR(p) 模型 , 其 边际 模型 为 ARMAI[kp, (k — 1)p]. VARMA 模 
型 的 结果 可 直接 从 VMA 与 VAR 模型 的 结果 中 得 到 . 

Bt [kp, (k—1)p+q) 是 边际 模型 的 最 大 阶 ( 即 上 界 ). ra 的 真实 边际 阶 可 能 会 更 
低 . 


8.5 ”单位 根 非 平稳 性 与 协 整 


当 对 儿 个 单位 根 非 平稳 时 间 序 列 联合 建 模 时 , 可 能 遇 到 协 整 的 情况 . 考虑 二 元 
ARMA(1,1) 模型 


Tit 0.5 —1.0 Tit-1 _ | an 0.2 —0.4 01,t—1 
Tot —0.25 0.5 To4—1 aot —U.1 0.2 Q24—1 
(8.31) 


其 中 扰动 a, 的 协 方差 矩阵 D 是 正定 的 . 这 并 不 是 一 个 弱 平 稳 模 型 , 因为 AR 系数 
矩阵 的 两 个 特征 值 分 别 为 0 和 1. 图 8-10 BH X: = 工时 的 200 个 模拟 数据 点 的 
时 间 图 ; 而 图 8-11 给 出 了 两 个 分 量 za 的 样本 自 相关 系数 . 很 容易 看 出 , 这 两 个 序 
列 具 有 高 度 自 相 关 而 且 表现 出 单位 根 非 平稳 的 特征 . oc, 的 两 个 边际 模型 的 确 是 单 
位 根 非 平稳 的 . 将 模型 改写 为 


1—0.5B B Tit | 1—0.2B U.4B ait 
0.25B  1—0.5H rn | 01B  1—03B ox || 


0 50 100 150 200 


时 间 
20 
10 

5 
U 
z i 
0 50 100 150 200 
时 间 


图 8-10 ” 当 扰 动 的 协 方差 抵 阵 为 单位 阵 时 , (8-31) 式 所 定义 模型 的 模拟 序列 的 时 间 图 
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序列 ; m, 


0.8 
6 
= 0.4 
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图 8-11 ” 当 扰 动 的 协 方差 矩阵 为 单位 阵 时 , (8.29) 式 所 定义 异型 的 两 个 模拟 分 量 序列 的 样本 自 
相关 函数 图 , 观测 值 为 200 个 


1—0.5B —B 
—0.25B 1-—0.5B 


1- B 0 Tit E 1 —0.7B —0.68 1t 
6 i-B za | | —015B 1—0.7B ay | 
因此 , 模型 的 每 个 分 量 mus 都 是 单位 根 非 平稳 的 , 且 服 从 一 个 ARIMA(O0, 1, 1) 模型 . 
然而 , 我 们 可 以 考虑 如 下 一 个 线性 变换 , 定义 


Yit 1.0 —2.0 TQ 

一 = Lz, 
Y2t 0.5 1.0 Tat 
1.0 —2.0 
lt = ait = La. 
bat 0.5 1.0 Gt 


变换 序列 y, 的 VARMA 模型 可 以 得 到 
La, c LÖT: st La, = LOa,_; 


= La i+ La, DOL La, 4, 
= SL (Lra) +b, LOL !b, ,. 


将 上 述 方程 乘 以 | | , 得 到 


这 样 , y, 的 模型 为 


yu | | 10 0 Yrie-1 | _ | Ore 0.4 0 bia (8.32) 
Yor 0 0 y2,t—1 bat 0 O bo 4 
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由 此 模型 看 出 : (a) yu 与 ya 是 分 离 序列 , 其 同步 相关 系数 等 于 扰动 bi 与 ba 之 
间 的 同步 相关 系数 ; (b) ye 服从 一 个 一 元 ARIMA(0,1,1) 模型 ; (c) yor 是 一 个 白 品 
声 序 列 (HU yo, = ba). 特别 地 , (8.32) 式 的 模型 表明 系统 中 只 有 一 个 单位 根 . 因此 
ru 与 we, 的 单位 根 是 由 ye 的 单位 根 引 入 的 . 在 相关 文献 中 , 称 加 为 xii 与 ro 
的 共同 趋势 . 

zl 与 wa 都 是 单位 根 非 平稳 的 但 在 向 量 序列 中 只 存在 一 个 单位 根 , 这 种 现象 
在 计量 经 济 和 时 间 序 列 文 献 中 称 为 协 整 (co-integration). 另 一 个 定义 协 整 的 方式 则 
着 眼 于 单位 根 非 平稳 序列 的 线性 变换 . 在 对 模型 (8.31) 进行 模拟 的 例子 中 , 变换 表 
明 线 性 组 合 yor = 0.5zit t ra 没有 单位 根 . 因此 , 称 zi 与 ro 是 协 整 的 , 如 果 (a) 
它们 两 个 都 不 是 单位 根 平稳 的 ; (b) 它们 的 一 个 线性 组 合 是 单位 根 平稳 的 . 

一 般 而 言 , 对 一 个 大 元 单位 根 非 平稳 时 间 序 列 , 如 果 系 统 中 的 单位 根 个 数 小 于 
k, 则 协 整 存在 . 令 h RR k 元 序列 zt 中 单位 根 的 个 数 ， 如 果 0 eh ck, WE 
在 协 整 ， 而且, 上 一 h 为 协 整 因子 的 数目 .换言之 , 协 整 因子 的 个 数 为 具有 单位 根 
平稳 性 的 不 同 线性 组 合 的 个 数 , 这 种 线性 组 合 称 为 协 整 向 量 ， 对 前 面 模拟 的 例子 ， 
yor = (0.5,1)zt, 因而 (0.5, 1) 是 系统 的 一 个 协 整 向 量 . 更 多 关于 协 整 和 协 整 检验 的 
讨论 , 可 参见 Box 和 Tiao(1977), Engle 和 Granger (1987), Stock 和 Watson (1988) 
以 及 Johansen (1988). 我 们 将 在 8.6 节 讨论 协 整 VAR 模 型 

协 整 的 概念 很 有 趣 , 并 且 在 文献 中 已 经 引起 了 人 们 的 大 量 关 注 . 然而 , 实际 应 
用 中 对 协 整 的 检验 有 些 困难 . 困难 的 主要 原因 是 协 整 检 验 忽视 了 分 量 序列 的 尺度 效 
应 . 感 兴趣 的 读者 可 以 参考 Cochrane (1988); Tian, Tsay 和 Wang (1993). 这 些 文 
献 中 有 进一步 的 讨论 . 

尽管 我 对 协 整 检验 的 实际 价值 感到 怀疑 , 然而 协 整 的 思想 与 金融 研究 是 高 度 相 
AM). 例如 , 考虑 Finnish Nokia 公司 的 股票 ， 它 在 Helsinki 股市 上 的 价格 必须 与 
纽约 证 券 交易 所 中 它 的 美国 信托 收据 (American Depositary Receipts) 的 价格 联动 ， 
否则 对 投资 者 而 言 就 存在 套利 机 会 . 如 果 股 价 有 单位 根 , 则 两 个 价格 序列 一 定 是 协 
整 的 . 实际 中 , 在 调整 交易 成 本 和 汇率 风险 之 后 , 就 存在 这 样 的 协 整 . 稍 后 在 8.7 节 
中 我 们 将 讨论 此 问题 . 


误差 -修正 形式 


因为 在 协 整 系统 中 , 单位 根 非 平稳 分 量 的 个 数 多 于 单位 根 的 个 数 , 所 以 对 于 单 
个 分 量 差 分 所 得 到 的 平稳 性 结果 是 差分 过 度 的 . 过 度 差分 导致 了 MA 和 矩阵 多 项 式 
中 的 单位 根 问题 , 这 反 过 来 可 能 在 参数 估计 中 会 遇 到 困难 . 如 果 MA AREA GR 
含 单位 根 , 则 称 向 量 时 间 序 列 是 不 可 逆 的 . 

Engle 和 Granger (1987) 讨论 了 一 个 协 整 系统 的 误差 修正 表示 . 它 克 服 了 不 可 
逆 的 VARMA 模型 估计 中 的 困难 . 考虑 (8.31) 式 的 协 整 系统 . 令 Aw, = zx, , 
是 差分 后 的 序列 . 将 ms 代入 方程 的 两 边 , 我 们 得 到 对 Aw, 的 一 个 模型 ， 
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Azit ET —0.5 — 1.0 Ti t-i 4 11 m 0.2 一 0.4 01,1—1 
Aro —0.25 —0.5 T94—1 (191 —0.1 0.2 2,4—1 
= | —1 | [0.5, 1.0] | Tı, t-i | + | ait | T | 0.2 —0.4 | | G1.t—1 | 
—0.5 T241—1 21 —0.1 0.2 24-1 


这 是 一 个 平稳 模型 , 因为 Ac, 与 [0.5,1.0] a, = yo, 都 是 单位 根 平稳 的 . 因为 上 述 
方程 的 右 端 用 到 了 s1, 所 以 MA 和 矩阵 多 项 式 同 未 差分 前 一 样 , 从 而 模型 不 会 遇 
到 不 可 逆 问 题 . 此 公式 称 为 Aa, 的 误差 -修正 模型 (error—correction model). 它 可 


以 扩展 到 一 般 的 协 整 VARMA 模型 .对 一 个 具有 m 个 协 整 因子 (m < k) Ii 
VARMA(p, q) 模型 , 其 误差 修正 表示 为 


Ax, = a’ ay; + Y: i ATi + GE 一 y 0;a...j, (8.33) 
=1 Jai 
这 里 a 和 B 都 是 上 x m MERE. AR RAGE OT 是 原始 系数 矩阵 9; 的 函数 ， 
具体 地 , 我 们 有 


af’ —9,- 0, ,-----9)-I--(1) (8.34) 


该 结果 是 令 AR FARES Wish) BL EAS (RIT. 时 间 序 列 'm, 是 单位 根 平稳 
的 , 并 且 B 的 行 向 量 为 zw; 的 协 整 向 量 . 

在 误差 修正 表示 (8.33) 中 出 现 平稳 序列 8'z,_1 是 很 自然 的 , 可 以 将 它 认为 是 
过 度 差分 系统 Aw, 中 的 一 个 “弥补 ”项 . B'a 平稳 性 的 证 明 如 下 : 单位 根 时 间 序 
列 理论 证 明了 单位 根 非 平稳 序列 与 平稳 序列 之 间 的 样本 相关 系数 在 样本 量 趋 于 无 
穷 时 收敛 到 0. 参见 Tsay 和 Tiao(1990) 及 其 参考 文献 . 在 一 个 误差 -修正 表示 中 ， 
Tii 是 单位 根 非 平稳 的 , 但 是 Ar, 是 平稳 的 . 因此 , 将 Az, 与 mcs 有 意义 地 联系 
起 来 的 唯一 方式 是 通过 平稳 序列 BT. 

注释 : ”我 们 对 协 整 的 讨论 假定 所 有 的 单位 根 重 数 为 1, 但 是 这 个 概念 可 以 扩 
展 为 单位 根 为 多 重 的 情形 . 如 果 协 整 因子 的 个 数 m. 给 定 , 则 (8.33) 式 的 误差 -修正 
模型 仍然 可 以 通过 似 然 方法 来 估计 . 下 一 节 我 们 将 讨论 协 整 VAR 模 型 的 简单 例子 . 
最 后 , 有 许多 方式 可 以 用 来 构造 误差 -修正 表示 . FKL, 在 (8.33) AP, 只 要 对 AR 
系数 矩阵 DB) 进行 菜 些 修 正 , 则 对 任何 的 v 满足 1<v<p, 都 可 以 用 QfB'z1_,. O 


8.6 the VAR #4 


为 了 个 更 好 地 理解 协 整 , 我 们 集中 讨论 VAR 模 型 , 这 主要 是 因为 它们 很 容易 估 
计 . 考虑 可 能 带 有 趋势 项 的 大 元 VAR(p) 时 间 序 列 ay: 
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C, = Hn, 01m; 1 Toga, (8.35) 


其 中 新 息 as 为 高 斯 的 , 并 且 u, = po + yt, 这 里 po 和 p, 都 是 大 维 常数 向 量 . 记 
$(B)—1—4,B—--.—9,B". WR |e(B)| 的 所 有 根 都 在 单位 圆 外 , 则 m, 是 单位 
根 平稳 的 . 在 相关 文献 中 , 称 一 个 单位 根 平 稳 过 程 为 1(0) 过 程 , 即 该 过 程 是 不 可 加 
的 . d |e(1)| = 0, 则 称 zt 为 单位 根 非 平稳 的 . 为 简单 起 见 , 我 们 假定 v, 至 多 是 一 
阶 可 加 过 程 , BE r(1) 过 程 . 这 意味 着 , 如 果 ra 不 是 单位 根 平稳 的 , 则 (1 一 B)zi 是 
单位 根 平稳 的 . 

VAR(p) WE r 的 误差 -修正 模型 (ECM) 具有 如 下 形式 : 


Ag, = p, c Iiri + PAT T4 Dj Att pui + ay, (8.36) 


其 中 p? 由 (8.34) REX, H II = af’ = —9(1). 我 们 称 (8.36) 式 的 May WR 
差 - 修 正 项 , 该 项 在 协 整 研究 中 起 着 非常 重要 的 作用 . 注意 到 更 ; 可 以 由 ECM 表示 
通过 下 式 恢 复出 来 : 
o, = + II 十 i, 
更; =0 -P i—2,..,p 
其 中 oer APEE EF mr 至 多 是 1(1) 过 程 的 假定 , 有 (8.36) 式 的 Ar, Æ 1(0) 
过 程 . 
如 果 a, 包含 单位 根 , 则 S1) = 0, 从 而 a= #0) 是 奇异 的 . 所 以 在 考虑 
(8.36) 式 的 ECM 时 , 有 下 面 三 种 情况 . 
(1) Rank(II) = 0, 这 意味 着 O = 0 且 不 是 协 整 的 ，(8.36) 式 的 ECM 退化 
为 
AT: = He + Pi Aa; 十"… 十 $7 14AP p 十 at， 


因此 Aa, 服从 带 确定 性 趋势 uu 的 VAR(p — 1) 模型 . 

(2) Rank(II) = k. 这 意味 着 |0(1)| A 0, 从 而 c, 不 包含 单位 根 , 即 a, 是 I(0) 
过 程 . 此 时 ECM 模型 是 无 效 的 , 直接 研究 x, 即 可 . 

(3) 0 < Rank(II) = m < k. 在 这 种 情形 下 , 可 以 将 BA II — ap, 其 中 a 
和 B RWE kx m HPEH. Rank(a) = Rank(B) = m. (8.36) R ECM 变 为 


II = af’, (8.37) 


这 意味 着 m. 是 协 整 的 , 有 m 个 线性 独立 的 协 整 向 量 w = p'en 有 上 人 一 mr 个 单位 
根 , 这 些 单位 根 给 出 了 oo, 的 大 一 mm 个 公共 随机 趋势 . 

如 果 zt 是 协 整 的 并 且 Rank(II) = m, 则 得 到 这 上 大 一 mm 个 公共 趋势 的 一 个 简单 
办 法 是 先 计 算 a 的 正 交 补 窍 阵 al, Bl ey Æ kx (k— m) 矩阵 并 且 满 足 a' a = 0. 
这 里 的 0 Æ k x (k — m) MEERE 然后 令 y, = a a. 实际 上 , 在 ECM 两 端 左 乘 
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a, 并 利用 II = ap', 所 得 到 的 方程 不 再 含有 误差 -修正 项 . 因此 大 一 mn 维 向 量 y, 
MZA k — m 个 单位 根 , 为 进一步 说 明 , 考虑 8.5.1 节 的 二 元 例子 . 对 于 该 特殊 情 
形 , o. = (一 1, 一 0.5)', al = (1,—2)'. 因此 y, = (1, -2) ay = zi; — 2ra, 这 正 是 (8.32) 
式 的 单位 根 非 平稳 序列 yir. 

注意 到 (8.37) 式 的 因子 分 解 是 不 唯一 的 , 因为 对 于 任何 m x m 阶 正 交 矩阵 Q 
满足 20! = I, 我 们 有 


aft! =an0' 8' = (aQ)(60) = a.b, 


其 中 at 和 B* 的 秩 都 是 m. 车 要 唯一 确定 a 和 GB, 则 需要 额外 的 限制 条 件 . 通常 
BER B' = [Im Bi] 其 中 Im 是 m x m 单位 阵 . B, Æ (k — m) x m ER. 实际 中 , 这 
可 能 要 求 将 m. 的 分 量 进行 重 排 , 使 得 前 m 个 分 量 都 有 单位 根 . 为 了 使 o. = B'r 
是 单位 根 平稳 的 , a 和 B 的 分 量 必 须 满足 其 他 的 限制 . 例如 , 考虑 有 一 个 协 整 向 量 
的 二 元 VAR(1) 模型 . 这 里 ,= 二 2, m= 1, ECM 是 


a 
Aa, = Ai + | i | [1, 31] 4-1 + ay. 
(02 


在 上 式 中 左边 同 乘 以 p, AV wei = B's 并 且 将 wi_1 移 到 方程 的 右边 , 我 们 
可 以 得 到 
we = f' p, + (1 + a1 + aoi), 1 + be, 

其 中 b = Bay. 这 意味 着 w 是 平稳 AR(1) 过 程 . 因此 , of 和 3. 必须 满足 平稳 性 
限制 |1 + aa + a2 f;| <1. 

前 面 的 讨论 表明 , 在 (8.36) 式 的 ECM 中 , TE 的 秩 是 协 整 向 量 的 个 数 . 因此 要 检 
验 协 整 , 只 需要 检查 II 的 秩 . 这 正 是 Johansen(1988, 1995) 和 Reinsel 和 Ahn(1992) 
所 采用 的 方法 . 


8.6.1 确定 性 函数 的 具体 化 


类 似 于 一 元 的 情形 , 协 整 检验 的 极限 分 布依 赖 于 确定 性 函数 pe, AC REGE 
论文 献 中 己 有 的 u, 的 具体 指定 问题 . 为 了 理解 下 面 的 一 些 陈述 , 记 住 a m, 对 于 
协 整 序列 ce 的 共同 随机 趋势 给 出 了 一 种 表示 . 

(1) ye, = 0: 此 时 z, 的 所 有 分 量 序列 都 是 不 带 漂移 项 的 I(1) 过程, 平稳 序列 
w = Alo, 的 均值 为 0. 

(2) py = po — «co, 其 中 co 是 m 维 非 零 常数 向 量 . ECM 变 为 


Az = a(B'm,. 十 Co) + P ATi 十 “十 @), Art—p+1 + ae, 


因此 zt 的 所 有 分 量 序列 都 是 不 带 漂移 项 的 I(1) 过 程 , 但 是 o, 有 非 零 均 值 -co. 
这 是 限制 为 常数 的 情形 . 
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(3) My = Ho #0. 这 时 , a, 的 所 有 分 量 序 列 都 是 带 漂移 项 jwo 的 I(1) 过程 且 
wt 有 非 零 均值 . 
(4) yo, = Ho + acyt, 其 中 Ci 是 非 零 向 量 . ECM ABA 


Ax, = po + e(B'z, 4 + ct) + PAT HH O71 Aw p41 ta, 
(8.38) 


因此 z, 的 所 有 分 量 序列 都 是 带 漂移 项 poy 的 1(1) 过 程 且 w 有 与 cit 相 联系 的 线 
性 时 间 趋 势 . 这 是 带 限 制 性 趋势 的 情形 

(5) 14 = Ho + pit, 其 中 u; 是 非 零 的 . 这 里 常数 和 趋势 都 是 没有 限制 的 . m, 的 
分 量 都 是 带 二 次 时 间 趋 势 的 1(1) 过 程 , w 具有 线性 趋势, 
显然 , 最 后 一 种 情形 在 实证 工作 中 不 是 很 常见 . 对 于 经 济 序列 而 言 第 一 种 情况 也 不 
常见 , 但 是 可 以 代表 某 些 资产 的 对 数 价格 序列 . 第 三 种 情况 在 给 资产 价格 建 模 时 也 
很 有 用 . 


8.6.2 ”最 大 似 然 估计 


本 小 节 将 简要 州 出 协 整 VAR(p) 模型 的 最 大 似 然 估 计 方 法 . 假设 数据 为 (ot = 
1,… T} 不 失 一 般 性 , 记 jp = udi, 其 中 d, = [1,0], 这 可 以 理解 为 jv, 依赖 于 前 
一 小 节 的 具体 指定 . 对 于 给 定 II 的 秩 m, ECM 模型 变 为 


Az, — pd, + e'a, 4 cA. aq +--+ | $5 Aa—pys + ay, (8.39) 


其 中 上 = 了 二 1 VT. 估计 中 关键 的 一 步 集中 在 与 确定 性 项 和 平稳 效应 相 联系 的 
似 然 函数 上 . 这 可 以 通过 考虑 下 面 的 两 个 多 元 线性 回归 得 到 


Ac, = Yodi + 2, Aa, a E Np-1Aayp4i Urn (8.40) 


Tii = Yide + SiAm, a + +++ EV Am pit vi (8.41) 


4 ty, MO, 分 别 表示 (8.40) 式 和 (8.41) 式 的 残 差 . 定义 下 述 样本 协 方差 矩阵 


1 T 
^ al » m 
Wd, Su-— T5 » Ut. 
1 Pan 


S 1 T X xf S 1 A 
00 一 T EY PM TM. 01 一 ; m 二 
接 下 来 , 计算 SoS Sa 关于 Sii 的 特征 值 和 特征 向 量 . 这 等 价 于 求解 下 述 特征 
值 问 题 : 
IASit Sios Sol = 0. 


将 特征 值 和 对 应 的 特征 向 量 记 为 (Nei), 其 中 A, > Ag > … 和. 这 里 特征 向 量 已 
经 标准 化 了 , 即 e'Sie — I, 其 中 e= |e1,… eu] 是 特征 向 量 矩 阵 . 
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UM IRE 8 的 未 标准 化 的 最 大 似 然 估 计 (MLE) 是 B = [ei,… ,em], 由 此 可 以 得 到 
B 的 满足 识别 性 限制 和 标准 化 条 件 的 MLE. 将 得 到 的 估计 记 为 Ba 其 中 下 标 c 
示 满 足 一 定 限 制 . 其 他 参数 的 MLE 可 以 由 下 述 多 元 线性 回归 得 到 : 


af 
Ac, = pd; + e,r, 4 IAT ai + +++ + 1ALTt_pti + ay. 


基于 m 个 协 整 向 量 的 似 然 函 数 的 最 大 值 为 
L=2/" x |Soo| [la = AM. 
i=l 


在 检验 Rank(II) = m 的 似 然 比 检验 中 会 用 到 该 最 大 值 . 最 后 a 和 有 的 正 交 补 可 
以 由 下 式 得 到 : 


ay A Soo Salem B ,€k]; B, m Siifémi, , ex]. 
8.6.3 ” 协 整 检验 


对 于 具体 的 确定 性 项 j,, 我 们 来 讨论 检验 (8.36) 式 中 矩阵 TI. 的 秩 的 最 大 似 然 
检验 . 令 H(m) 为 零 假 设 : Rank(II) = m, 例如 , 在 H(0) F, Rank(II) = 0, 从 而 
II = 0, 即 没 有 协 整 . 这 些 零 假设 具有 如 下 关系 


H(0)c---c H(m)c -C H (k). 
为 进行 检验 , (8.39) 式 变 为 
Ac, = pd, + IIz, + pi Axı 证 $5 jAÀz pal + dat; 


其 中 t=p 十 1,…,T. 我 们 的 目标 是 检验 TI 的 秩 . 从 数学 上 来 讲 , Me TI 的 
非 零 特征 值 的 数目 ,从 而 如 果 能 得 到 TII 的 相合 估计 , 则 可 以 估计 II 的 秩 , 基于 前 
面 的 方程 (该 方程 是 多 元 线性 回归 的 形式 ), 我 们 看 到 TI 是 调整 d, 和 Ax, (i= 
1,… ,Dp 一 1) 带 来 的 效应 后 sm 和 Am 的 协 方差 矩阵 . 必要 的 调整 可 以 由 上 一 小 
节 处 理 多 元 线性 回归 的 技巧 得 到 . 事实 上 , 调整 后 的 wi 和 Am, 2B 0, 和 s. 
于 是 进行 协 整 检验 的 方程 变 为 


ü, = Ilo, + ay. 


在 正 态 性 假设 下 , 可 以 用 c, 和 a, 的 典型 相关 分 析 进 行 上 式 中 rr 的 秩 的 似 然 比 
检验 . 关于 典型 相关 分 析 参 见 Johnson 和 Wichern(1998). 因为 已 经 调整 了 d, 和 
Arzi-il = 1,… ,p) 带 来 的 效应 , 所 以 与 典型 相关 分 析 由 联系 的 是 Azi 和 mu 
偏 典 型 相关 分 析 . 量 {AG} FE tee 和 D4 的 典型 相关 系数 的 平方 . 
考虑 假设 
H,:Rank(H) =m Xf H,:HRank(IH) > m. 
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Johansen(1988) 提出 下 述 似 然 比 检验 统计 量 来 进行 检验 : 


k 
LKe(m)=-(T-p) $5; In(1—À) (8.42) 
1—m4-1 
若 Rank(II) = m, W 4 i > m 时 À, 应 该 很 小 , 因此 LKtr(m) 也 应 该 很 小 ,该 检验 
称 为 迹 协 整 检 验 . 由 于 单位 根 的 存在 , LKt(m) 的 渐 近 分 布 不 再 是 x? 分 布 , 而 是 标 
准 布朗 运动 的 函数 . 因此 LKt(m) 的 临界 值 必须 通过 模拟 得 到 . 
Johansen(1988) 还 考虑 了 一 列 程序 来 确定 协 整 向 量 的 个 数 . 特别 地 , 考虑 下 述 
假设 : 
H,:Rank(I)—m 对 H,:Rank(II) =m-+1. 


LK 检验 统计 量 , 也 称 为 最 大 特征 值 统计 量 , 为 


^ 


LK max(m) = —(T — p)ln(1— den). 


同样 , Set RAY th FEE SF HEN, 必须 通过 模拟 来 得 到 . 
8.6.4 th VAR 模型 的 预测 


所 拟 合 的 ECM 模型 可 以 用 来 进行 预测 . 第 一 , 基于 被 估 参 数 , ECM 方程 可 以 
用 来 得 到 差分 序列 Aa, 的 预测 . 这 样 的 预测 可 以 反 过 来 得 到 m. OPI. ECM fü 
测 利 传统 的 VAR 预 测 的 区 别 在 于 用 ECM 方法 进行 预测 时 加 上 了 协 整 关系 . 


8.6.5 ”例子 


为 了 进一步 说 明 VAR 模 型 的 协 整 分 析 , 考虑 两 个 美国 短期 周 利率 . 序列 分 别 为 
1958 年 12 月 12 日 到 2004 年 8 月 6 日 的 3 个 月 期 和 6 个 月 期 的 国库 券 利 率 . 数 
据 来 自 于 二 级 市 场 , 是 从 圣 . 路 易 斯 联邦 储备 银行 得 到 的 . 图 8-12 给 出 了 利率 序列 
的 时 间 序 列 图 . 如 所 料想 , 这 酚 个 序列 的 运动 非常 靠近 . 

我 们 的 分 析 是 在 S-Plus 中 进行 的 , 进行 VAR 分 析 时 利用 命令 VAR, 进行 协 整 
检验 时 利用 命令 coint, 进行 向 量 误差 修正 估计 时 利用 命令 VECM. 分 别 用 tb3m 和 
tb6m 表示 两 个 序列 , 并 定义 向 量 序列 2, = (tb3m,tb6m)'. 扩展 的 Dickey-Fuller 单 
位 根 检验 不 能 拒绝 每 个 个 体 序列 有 单位 根 的 假设 . 参见 第 2 章 . 实际 上 , 当 给 3 个 
月 期 和 6 个 月 期 的 利率 序列 拟 合 AR(3) 模型 时 , 检验 统计 量 分 别 为 —2.34 和 —2.33. 
p 值 大 约 为 0.16. 这 样 , 我 们 继续 进行 VAR 建 模 . 

对 于 二 元 序列 ce BIC 准则 选择 了 VAR(3) 模型 . 

>x=cbind(tb3m,tb6m) 

>y=data.frame (x) 

»ord.choice$ar.order 

[1] 3 
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图 8-12 ”两 个 美国 短期 周 利率 的 时 间 序 列 图 , 样本 的 时 间 区 间 是 从 1958 年 12 月 12 日 到 


2004 年 8 月 6 日 . (a) 3 个 月 期 国库 券 利率 ; (b) 6 个 月 期 国库 券 利 率 . 数据 来 自 
二 级 市 场 


为 了 进行 协 整 检验 , 我 们 选择 常数 限制 的 u 因为 事先 没有 理由 相信 美国 利率 存在 
GB. Johansen 的 两 个 检验 都 证 实 了 拟 合 VAR(3) 模型 时 , 这 两 个 序列 是 有 一 个 协 


整 向 量 的 协 整 序列 . 
> cointst.rc-coint(x,trend-'rc', lags-2) % lags = p-1. 
> cointst.rc 
Call: 
coint(Y = x, lags = 2, trend = "rc") 


Trend Specification: 
Hl*(r): Restricted constant 


Trace tests sign. at 
Trace tests sign. at 
Max Eig. tests sign. 
Max Eig. tests sign. 


the 5% level are flagged by ' +’. 
the 1% level are flagged by '++’. 
at the 5% level are flagged by ' *’. 
at the 1% level are flagged by '**', 


Tests for Cointegration Rank: 


Eigenvalue Trace Stat 95% CV 99% CV 
H(0)++** 0.0322 83.2712 19.96 24.60 
H(1) 0.0023 5.4936 9.24 12197 
Max Stat 95% CV 99% CV 
H(0)++** 77.7776 15.67 20.20 
H(1) 5.4936 9.24 123594 


接 下 来 , 用 ECM 表示 对 该 协 整 VAR(3) 模型 进行 最 大 似 然 估 计 . 结果 如 下 : 
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> vecm.fit-VECM(cointst.rc) 
> summary (vecm. fit) 

Call: 

VECM (test = cointst.rc) 


Cointegrating Vectors: 


coint.1 

1.0000 

tbém -1.0124 
(std.err) 0.0086 


(t.stat) -118.2799 


Intercept* 0.2254 
(std.err) 0.0545 
(t.stat) 4.1382 


VECM Coefficients: 
tb3m tbém 
coint.1 -0.0949 -0.0211 
(std.err) 0.0199 20.0179 
(t.stat) -4.7590 -1.1775 


tb3m.lagl 0.0466 -0.0419 
(std.err) 0.0480 0.0432 


(t.stat) 0.9696 -0.9699 


tbém.lagl 0.2650 0.3164 
(std.err) 0.0538 0.0484 
(t.stat) 4.9263 6,5385 


tb3m.lag2 -0.2067 -0.0346 
(std.err) 0.0481 0.0433 
(t.stat) -4.2984 -0.8005 


tb6m.lag2 0.2547 .0994 
(std.err) 0.0543 0.0488 
(t.stat) 4.6936 2.0356 


o 


Regression Diagnostics: 
tb3m tb6m 
R-squared 0.1081 0.0913 
Adj. R-squared 0.1066 0.0898 
Resid. Scale 0.2009 0.1807 


> plot(vecm.fit) 
Make a plot selection (or 0 to exit): 


ls plot: All 
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2: plot: Response and Fitted Values 
3: plot: Residuals 


13: plot: PACF of Squared Cointegrating Residuals 
Selection: 


如 所 料想 , 输出 结果 表明 平稳 序列 为 w = tb3mt — tb6m,, w 的 均值 大 约 为 
—0.225. 拟 合 的 ECM 模型 为 


T M Ve 0.2 
Aa, 一 nil (wy —t 0.23) 十 in " ATi 
—0.02 一 0.04 0.32 


—0.21 0.25 
—0.03 0.10 


估计 的 au 的 标准 误差 分 别 为 0.20 和 0.18. 可 以 通过 不 同 的 图 来 检查 所 拟 合 模 型 
的 充分 性 ， 为 了 进一步 说 明 , 图 8-13 给 出 丁 协 整 残 差 图 . 在 图 中 有 一 些 大 的 残 差 ， 
这 发 生 在 1980 年 早期 , 利率 很 高 并 且 波 动 剧 烈 . 


ü 500 1000 1500 2000 
8-13 ”为 美国 短期 周 利 率 拟 合 的 ECM 的 协 整 残 差 图 . 样本 的 时 间 区 间 是 从 
1958 年 12 月 12 日 到 2004 年 8 月 6 日 


最 后 , 我 们 用 拟 合 的 ECM 模型 来 产生 Az, Ma, 的 向 前 1 步 预测 和 向 前 10 
步 预测 . 预测 原点 是 2004 年 8 月 6 日 . 图 8-14 和 图 8-15 分 别 给 出 了 差分 序列 和 
原始 序列 的 预测 图 . 这 两 个 图 中 都 包含 一 些 观测 数据 点 . 图 中 的 虚线 是 置信 水 平 为 
95% 区 间 预 测 . 由 于 单位 根 非 平稳 性 的 存在 , 该 区 间 很 宽 且 没有 实际 意义 . 


> vecm.fst=predict (vecm.fit, n.predict=10) 
> summary (vecm. fst) 


Predicted Values with 


tbàim 


l-step-ahead -0.0378 


(std.err) 


0. 


2009 


2-step-ahead -0.0870 


(std.err) 


0. 


3222 


10-step-ahead -0.2276 


(std.err) 


0. 


8460 
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Standard Errors: 


tbém 
-0.0642 
0.1807 
-0.0864 
0.2927 


-0.1314 
0.8157 


> plot (vecm. fst,xold=diff (x) ,n.old=12) 


> vecm.fit.level-VECM(cointst.rc,levels-T) 
> vecm.fst.level-predict(vecm.fit.level, n.predict-10) 
» summary(vecm.fst.level) 


Predicted Values with Standard Errors: 


1-step-ahead 
(std.err) 
2-step-ahead 
(std.err) 


is 
0. 
i. 
0. 


tb3m 
4501 
2009 
4420 
3222 


10-step-ahead 1.4722 


(std.err) 


0. 


8460 


1 
0 
i 
0 


1 
0 


tbém 
. 7057 
.1807 
TOLJ 
-2927 


. 7078 
-8157 


> plot (vecm.fst.level, xold-x, n.old=50) 


0.0 


—0.5 


一 1.0 
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指数 


图 8-14 ”利用 为 美国 短期 周 利率 拟 合 的 ECM 进行 预测 的 预测 图 . 预测 是 关于 差分 序列 的 ， 
且 预 测 原 点 是 2004 *E 8 A 6 H 
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2340 2350 2360 2370 2380 2390 


SS ee eee am 


2340 2350 2360 2370 2380 2390 


指数 
图 8-15 利用 为 美国 短期 周 利率 拟 合 的 ECM 进行 预测 的 预测 图 . 预测 是 关于 利率 序列 的 ， 
且 预 测 原 点 是 2004 年 8 月 6 日 


8.7 “门限 协 整 与 套利 


本 节 主 要 讨论 在 指数 父 易 中 利用 多 元 时 间 序 列 方法 探测 套利 机 会 , 同时, 我 们 
指出 , 与 协 整 思想 相 结合 , 第 4 章 中 简单 的 一 元 非 线性 模型 可 以 自然 地 推广 到 多 元 
情形 . 

我 们 的 研究 考虑 S&P500 指数 期 货 的 价格 与 现金 市 场 上 以 该 指数 为 标的 的 股 
份 价格 之 间 的 关系 . 令 fi 表示 到 期 时 间 为 1 的 指数 期 货 在 时 刻 t 的 对 数 价格 , AL 
令 s 表示 现金 市 场 上 的 以 指数 为 标的 的 股份 在 t 时 刻 的 对 数 价格 . 在 金融 文献 中 ， 
实现 成 本 模型 (cost-of-carry model) 的 一 个 版 本 认为 


fet 一 条 三 (rt — qu) — t) + 2t (8.43) 


这 里 r 是 无 风险 利率 , qi 是 关于 t 时 刻 现金 价格 的 红利 收益 , (1 0) 是 期 货 合约 
的 到 期 时 间 . 具体 可 参见 Brenner 和 Kroner(1995), Dwyer, Locke 和 Yu (1996) 及 
其 参考 文献 . 

模型 (8.43) 中 的 过 程 zp 必须 是 单位 根 平稳 的 , 否则 就 存在 持续 的 套利 机 会 . 
这 里 的 套利 交易 包括 , 当期 货 合约 在 到 期 日 以 前 的 对 数 价格 偏离 到 大 于 随时 间 持 有 
指数 的 成 本 时 , 同时 购买 ( 卖 空 ) 证 券 指数 , 并 卖 出 (购买 ) 指数 期 货 . 在 z; 的 弱 平 
稳 假 定 下 , 为 了 有 利 可 图 , zy 的 模 一 定 超过 一 个 由 交易 成 本 和 其 他 的 经 济 因素 和 风 
险 因素 决定 的 一 个 特定 值 , 
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通常 认为 S&P500 指数 的 fi 与 s 序列 都 包含 一 个 单位 根 , 但 是 (8.43) RE 
明 它们 在 调整 利率 和 红利 收益 的 影响 之 后 是 协 整 的 . 调整 后 的 协 整 向 量 为 (1, 一 1)， 
协 整 序列 是 op. 因此 , 应 该 利用 误差 -修正 形式 来 对 收益 率 序列 7 = (Afi, As E 
PR, 这 里 Afi = fea — frag, Ase 5 — sia, 并 且 为 了 记号 的 简便 , 我 们 将 到 期 时 
间 £JÀ Af, 的 下 标 中 去 掉 了 . 


8.7.1 多 元 门限 模型 


实际 中 , 套利 交易 影响 市 场 动态 , 从 而 , 依赖 于 套利 交易 的 存在 与 否 r 的 模型 
可 能 随时 间 变 化 . 因此 , 前 面 的 讨论 自然 地 引出 了 下 述 模型 


p 
ec 3 ar + 84211 t al), 2 Zi 1 & yi, 


i=1 


Pp 
Ti = Co + D + Bszt_1 十 al?) = ^h «€ Zt-i € 2; (8.44) 


i=] 


p 
€3 + > 十 BaZt_1 十 a, AG Yo € 211. 
其 中 2, = 10027, yi < 0 < ~ 是 两 个 实数 , {as”} 是 彼此 独立 的 二 元 白 品 声 序列 . 这 
里 我 们 用 z, = 100z7, 因为 zz 的 实际 值 相对 较 小 . 

(8.44) 式 中 的 模型 称 为 三 体制 的 多 元 门限 模型 ， 两 个 实数 y A yo ETR, 
a-i 是 门限 变量 .门限 变量 z,_, 是 由 数据 支持 的 (参见 Tsay(1998)). 一 般 考 虑 
d € {1,… ,do}, 可 以 选择 z,_4 作为 一 个 门限 变量 , 其 中 do 是 一 个 预先 指定 的 正 整 
X. 

模型 (8.44) 是 第 4 章 中 门限 自 回归 模型 的 推广 . 它 也 是 (8.33) 式 中 误差 -修正 
模型 的 推广 如 前 所 提 到 的 , 只 有 当 ot ( 或 等 价 地 , z,) 的 模 相当 大 时 , 套利 交易 才 
是 有 利 可 图 的 . 因此 模型 (8.44) 只 有 在 体制 1 和 体制 3 会 有 套利 交易 发 生 . 这 样 
体制 2 中 的 fii 与 se 间 的 动态 关系 主要 是 由 正常 市 场 力量 决定 的 , 从 而 两 个 序列 
或 多 或 少 类 似 于 一 个 随机 游 走 . 换 句 话说 , 中 间 体 制 的 两 个 对 数 价 格 应 该 不 受 套利 
的 影响 , 从 而 也 不 受 协 整 的 限制 . 从 经 济 计量 的 观点 看 , 这 意味 着 中 间 体 制 6。 的 估 
计 应 该 是 不 显著 的 . 

总 之 , 我 们 期 望 期 货 的 对 数 价格 与 现金 市 场 上 的 证 券 指 数 的 对 数 价格 之 间 的 协 
整 效应 在 体制 1 与 体制 3 中 都 是 显著 的 , 但 是 在 体制 2 中 不 显著 . 这 种 现象 称 为 门 
限 协 整 . 可 参见 Balke 和 Eomby (1997). 


8.7.2 ”数据 


在 下 面 的 实例 研究 中 使 用 的 数据 是 S&P500 指数 在 1993 年 5 月 的 日 内 交易 
数据 与 它 在 芝加哥 商品 交易 所 的 6 月 份 期 货 合 约 . 上 有 具体 可 参见 Forbes, Kalb 和 
Kofman(1999). 他 们 利用 这 个 数据 构造 了 一 个 具有 7 060 个 观测 值 的 每 分 钟 的 二 元 
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价格 序列 . 为 了 避免 异常 收益 率 的 过 渡 影 响 , 我 们 将 10 个 异常 值 (每 边 5 个 ) 用 与 
它们 最 近 的 两 个 值 的 简单 平均 来 代替 . 这 一 步 并 不 影响 分 析 的 定性 结论 , 但 是 可 能 
影响 数据 的 条 件 异 方差 性 . 为 了 简便 , 我 们 在 研究 中 不 考虑 条 件 异 方差 性 . 图 8-16 
是 指数 期 货 和 现金 价格 的 对 数 收 益 率 的 时 间 序 列 图 , 与 模型 (8.43) 相应 的 门限 变 
E z = 10022. 

(a) 对 数 期 货 的 1 阶 差分 


0.001 
0.0 
- 0.001 


ü 2000 3000 6000 
时 间 指 数 
(b) 对 数 价格 的 1 阶 差 分 
0.002 
0.001 
0.0 
-0.001 
0 2000 4000 6000 
时 间 指 数 
(c) 局 序列 
0.2 | 
0.0 
-0.2 
0 2000 4000 6000 
时 间 指 数 


图 8-16 1993 年 5 H S&P500 指数 期 货 和 现金 价格 的 1 分 钟 对 数 收 益 举 的 时 间 图 及 其 
相关 的 门限 变量 . (a) 指数 期 货 的 对 数 收益 率 ; (b) 指数 现金 价格 的 对 数 收益 率 ; 
(c) ze 序列 


8.7.3 ”估计 


(8.44) 式 中 多 元 门限 模型 的 一 个 正式 识别 包括 选择 门限 变量 ,决定 体制 个 数 
以 及 对 每 个 体制 选择 阶 py， 感 兴趣 的 读者 可 以 参考 Tsay(1998); Forbes, Kalb 和 
Kofman(1999). 我 们 可 以 利用 一 些 信息 准则 (如 Akaike 信息 准则 [AIC] 或 残 差 的 
平方 和 ) 来 估计 门限 Xx A y 假定 p = 8, de {1,2,3,4}, x € [一 0.15, 一 0.02]， 
y2 € [0.025, 0.145], 并 利用 格 点 搜索 方法 (每 个 区 间 内 有 300 个 点 ), AIC 选择 zi 
作为 门限 变量 时 , 门限 为 9 = —0.022 6, 5 = 0.037 7. 参数 估计 的 细节 见 表 8-8. 

由 表 8-8 我 们 观测 到 如 下 几 点 . 第 一 , 中 间 体 制 中 o 的 七 比 表 明 , 如 我 们 所 
料 , 该 估计 在 5% 水 平 下 不 显著 , 从 而 证 实 了 当 不 出 现 套利 机 会 时 , 两 个 对 数 价 格 之 
间 没 有 协 整 . 第 二 , 对 所 有 三 个 体制 , Afi 都 与 Afi_i 负 相 关 . 这 与 第 5 章 所 讨论 的 
买卖 弹性 是 一 致 的 . 第 三 , 带 数 期 货 的 过 去 对 数 收益 率 看 上 去 比 现金 价格 的 过 去 对 
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数 收益 率 包含 更 多 的 信息 , 因为 Afii E As,_; 具有 更 显著 的 e 比 . 这 是 合理 的 ， 
因为 一 般 来 说 , 指数 期 货 的 流动 性 更 强 . 关于 指数 套利 的 更 多 信息 , 可 参见 Dwyer, 
Locke 与 Yu (1996). 


d 8-8 ”给 1993 年 5 月 的 S&P500 指数 数据 拟 合 (8.44) 式 中 的 多 元 门限 模型 时 参数 的 
最 小 二 乘 估计 及 它们 的 三 比 * 
[AR as | 


Aft As: Aft Ast 


0.0002 0.00005 0.00000 0.00000 —0.00001 一 0.00005 
t (1.47) (7.64) (—0.07) (0.53) (—0.74) (—6.37) 
Aft-1 —0.08468 0.07098 —0.03861 0.04037 一 0.04102 U.02305 
t (—3.83) (6.15) (—1.53) (3.98) (—1.72) (1.96) 
Aft-2 —0.00450 0.15899 0.04478 0.08621 —0.02069 0.09898 
t (—0.20) (13.36) (1.85) (8.88) (—0.87) (8.45) 
Aft—s 0.02274 0.11911 0.07251 0.09752 0.00365 0.08455 
t (0.95) (9.53) (3.08) (10.32) (0.15) (7.02) 
Afi—« 0.02420 0.08141 0.01418 0.06827 —0.02759 0.07699 
t (0.99) (6.35) (0.60) (7.24) (—1.13) (6.37) 
Afi-s 0.00340 0.08936 0.01185 0.04831 —0.00638 0.05004 
t (0.14) (7.10) (0.51) (5.13) (—0.26) (4.07) 
Aft—6 0.00098 0.07291 0.01251 0.03580 —0.03941 0.02615 
t (0.04) (5.64) (0.54) (3.84) (—1.62) (2.18) 
Afi-7 —0.00372 0.05201 0.02989 0.04837 —0.02031 0.02293 
t (—0.15) (4.01) (1.34) (5.42) (—0.85) (1.95) 
Aft—« 0.00043 0.00954 0.01812 0.02196 —0.04422 0.00462 
t (0.02) (0.76) (0.85) (2.57) (—1.90) (0.40) 
Aast) —0.08419 0.00264 一 0.07618 一 0.05633 0.06664 0.11143 
t (—2.01) (0.12) (—1.70) (—3.14) (1.49) (5.05) 
Ast—2 —0.05103 0.00256 —0.10920 —0.01521 0.04099 —0.01179 
t (—1.18) (0.11) (—2.59) (—0.90) (0.92) (—0.53) 
Asia 0.07275 —0.03631 —0.00504 0.01174 —0.01948 —0.01829 
t (1.65) (一 1.58) (一 0.12) (0.71) (一 0.44) (—0.84) 
Asia 0.04706 0.01438 0.02751 0.01490 0.01646 0.00367 
t (1.03) (0.60) (0.71) (0.96) (0.37) (0.17) 
Ast_s 0.08118 0.02111 0.03943 0.02330 一 0.03430 一 0.00462 
t (1.77) (0.88) (0.97) (1.43) (—0.83) (—0.23) 
Ast_6 0.04390 0.04569 0.01690 0.01919 0.06084 —0.00392 
t (0.96) (1.92) (0.44) (1.25) (1.45) (—0.19) 
Ast-7 —0.03033 0.02051 —0.08647 0.00270 —0.00491 0.03597 
t (—0.70) (0.91) (—2.09) (0.16) (—0.13) (1.90) 
Asta 一 0.02920 0.03018 0.01887 —0.00213 0.00030 0.02171 
t (—0.68) (1.34) (0.49) (—0.14) (0.01) (1.14) 
24—1 0.00024 0.00097 —0.00010 0.00012 0.00025 0.00086 


(1.34) (10.47) (—0.30) 
a 三 个 体制 的 数据 点 分 别 为 2 234, 2 410 和 2 408. 


(0.86) 


(1.41) (9.75) 
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附录 A 向 量 与 矩阵 的 回顾 


附录 A 主要 回顾 向 量 与 矩阵 的 一 些 代 数 性 质 . 这 里 没有 给 出 证 明 , 因为 相关 
证 明 在 关于 和 矩阵 的 标准 教科 书 (如 Graybill, 1969) 中 都 可 以 找到 . 
一 个 m x n SARE A m 行 n 列 的 实数 组 成 的 数组 , 例如 ， 


A-| 1s 4l 
—{ 3 4 


是 一 个 2 x 3 ERE. 该 矩阵 有 2 行 3 列 . 一 般 地 , 一 个 m x n 矩阵 可 以 写 为 


11 erg) aos 1,n—1 Gin 
421 agg ^^^ ü2.n—1 azn 

Az[a]-| . . «| (8.45) 
Qm] Gm2 "'' QAmn-1 mn 


正 整 数 m An A A 的 行 数 和 列 数 , 实数 ai; 称 为 A 的 第 (3) 个 元 素 . 尤其 是 , 元 
素 a; 是 矩阵 的 对 角 线 元 素 . 

一 个 m x 1 矩阵 形成 一 个 m 维 列 向 量 , 且 一 个 1 x n WERE A n HET 
T. 文献 中 的 向 量 一 般 指 列 向 量 . 如 果 m = n, 则 矩阵 是 一 个 方 阵 . RR iA j 
H a —0, 且 m= n, WERE A 为 一 个 对 角 和 矩阵 . 如 果 对 于 ij ay = 0, 而 且 
对 所 有 的 i 计 有 aii = 1, 则 4 是 一 个 m x m 单位 矩阵 , 通常 用 Imn 表示 , 或 当 维 数 
清楚 时 简单 表示 为 I. 


n x m ERE 
411 Q21 vL m-l, Arl 
i 412 022 `= Qm-1,2 m2 
T uem 
Qin Gan ^^: Om—1n  Gmn 
iir 4 58 
是 矩阵 A 的 转 置 . 例如 , | 5 3 | 是 | i 3 | 的 转 置 . 我 们 利用 记号 A’ = 
8 4 


[aj] 来 表示 A 的 转 置 . 由 定义 得 出 of = aji 且 (A'Y = A. WR A' = A, W A J 
—^A BE. 
基本 运算 

假设 A = [aij|mxn, C = [cij]pxo 是 两 个 矩阵 , 它们 的 维 数 在 下 标 中 给 出 . + b 
是 一 个 实数 . 一 些 基本 的 矩阵 运算 定义 如 下 . 

e 加 法 : WR m=p H n= «Jl A+C = [os 十 camxni 
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e 减法 : WR m =p, n=g, 则 A 一 C= [ai — cij]mxn: 

e. 标量 乘法 : bA = [bass] mx: 

e 乘法 ; 车 n = p, 则 AC = È QiyCuj 

当 和 矩阵 维 数 满足 乘法 的 运算 条 件 时 ， 两 个 矩阵 称 为 可 相 乘 的 (conformable). 下 
式 是 和 矩阵 乘法 的 一 个 例子 : 


f all Ls tori e 2x2+1x2 2x3-1x4 


iod eom ed 1x1—-1x1 1x2-1x2 1x3-1x4 
iiw 3 
qu ub «x 1^ 
矩阵 运算 的 重要 法 则 包括 : 
(a) (AC)' = C'A’; 


(b) 一 般 情况 下 , AC 4 CA. 
it. yh. 特征 值 与 特征 向 量 


称 方 阵 Amxm 是 非 奇 异 的 或 可 逆 的 , 如 果 存 在 一 个 唯一 的 矩阵 Cine, 满足 
AC = CA = Im, 其 中 , Im 是 mx m 单位 阵 . 在 这 个 情形 , C RRA A HORE, 
记 为 C = 4 一 

Amxm 的 迹 是 它 的 对 角 线 元 素 的 和 (BI tr(4) 一 Xa). 很 容易 看 出 : (a) 
tr(A + C) — tr(A) + tr(C); (b) tr(A) = tr(A’); (c) 假设 两 个 矩阵 是 可 相 乘 的 则 
tr(AC) = tr(C A). 

如 果 Ab = Ab, 则 数 和 与 m x 1 向 量 b( 可 能 是 复 值 ) 就 是 矩阵 A 的 一 个 
右 特 征 值 与 右 特征 向 量 对 .和 矩阵 A 有 mm 个 可 能 的 特征 值 . 对 实 和 矩阵 A, 复 特征 
(HIE3EBUIHEABS. ABER A 是 非 奇异 的 当 且 仅 当 它 的 所 有 的 特征 值 都 不 为 0. 用 
(ili = 1,.… ,m} 表示 特征 值 , 则 我 们 有 tr(A) = 3 另外 , 矩阵 A 的 行列 式 
可 以 定义 为 |4| = Il Ai 对 矩阵 行列 式 的 一 般 定 义 , n] AB LSE Rb WEBS aE BOT 
(如 Graybill, 1969). 

最 后 , 矩阵 As 的 秩 是 对 称 和 矩阵 ALA! 的 非 零 特征 值 的 数目 . 对 一 个 非 奇异 
HRE A, 还 有 (Ay = (A'L 
正定 矩阵 

称 方 阵 A(m x m) 是 一 个 正定 矩阵 , 如 果 (a) A 是 对 称 的 ; (b) A 的 所 有 特征 


值 都 是 正 数 . 另外 一 种 定义 : 如 果 对 任何 非 零 的 m 维 向 量 b, WA b Ab > 0, 则 A 
是 正定 矩阵 . 
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IEE A 的 有 用 性 质 包 括 : (a) A 的 所 有 特征 值 都 是 正 实数 ; (b) 和 矩阵 4 可 

以 分 解 为 
A= PAP’, 

其 中 A 是 一 个 包含 4 的 所 有 特征 值 的 对 角 和 矩阵 , P 是 一 个 包括 A 的 m 个 右 特 
征 向 量 的 m x m AREE. 通常 将 特征 值 写 为 Xi > Xz > +++ > Am, 相应 的 特征 向 量 
el ,em 满足 Ae, = Xie; A ele; — 1. 另外 , 如 果 特 征 值 不 同 的 话 , 这 些 特征 向 
TEE SS (BNR i A j, 则 ete; = 0). 矩阵 P 是 一 个 正 交 和 矩阵 , 这 个 分 解 称 为 矩 
阵 A 的 谱 分 解 . 例如 , 考虑 简单 的 2 x 2 矩阵 


它 是 正定 的 . 简单 的 计算 表明 : 


2 1 IPE 8 4 i? Ll. 3 

Leo) “bey” Le whl ey (a 
因此 , 3 与 1 是 x 的 特征 值 , PREGA RPE MSY DR. (4, 15) 和 (5 3.) 
很 容易 证 明 如 下 谱 分 解 成 立 


EA aH 
«X adili Ji E 9 1 
对 于 对 称 和 矩阵 A, 存在 一 个 对 角 线 上 元 素 为 1 的 下 三 角 和 矩阵 L 以 及 对 角 和 矩阵 


G, 满足 A 一 LGL'. 参见 Strang (1980) 的 第 1 章 . 如 果 A 是 正定 的 , 则 G 的 对 
角 元 素 全 是 正 的 . 在 这 种 情形 下 , 我 们 有 


A=LVGVGL' = LY G(LvGY, 


其 中 LYG 又 是 一 个 下 三 角 矩 阵 , 其 平方 根 是 逐个 元 素 取 的 . 这 个 分 解 称 为 4 的 
Cholesky 分 解 , 它 证 明了 正定 和 矩阵 A 可 以 对 角 化 , 因为 


LAL) = AL Y =G. 


因为 工 是 具有 单位 对 角 元 素 的 下 三 角 和 矩阵 , 所 以 L^! 也 是 具有 单位 对 角 元 素 的 下 
三 角 和 矩阵 . 再 次 考虑 前 面 的 2 x 2 FERED, 容易 验证 


二 二 1.0 0.0 ge- 2.0 0.0 
0.5 1.0 0.0 1.5 


we D= LGL'. 另外 ， 


mfi to): = aye 
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拉 直 与 Kronecker 积 

将 mx n 矩阵 A 用 它 的 列 写 为 A = [a1,:… ,an], 定义 拉 直 算 子 为 vec(A) = 
(a1,a5,*-* T P^ TET mn x l 维 问 量 . 对 两 个 和 矩阵 Amxn 与 Cxq; A 与 C 
的 Kronecker HFR HJ 


aC  aiC ë => aj4,4C an 

42310 aC  -.. ag, 1C ag,C 
AGC- i J à . 

AmiC Am2C "E Amn-1C GmnC 


mpxnq 


例如 , 假定 


a-| 1i] e-| 43 4 
=} 4d —2 5 2 
则 vec(4) = (2, —1, 1, 3)', vec(C) = (4, —2, —1,5,3,2)', H. 


8 —2 6 4 —l. 3 
—4 10 4 一 2 o 2 
—4 1 -3 12 -3 9 

2 —0 -2 -6 15 6 


假设 维 数 是 合适 的 , 则 对 上 述 两 个 算 子 , 我 们 有 下 面 有 用 的 性 质 : 
(1) 一 般 地 , A@C ACA; 
(2) (A@C)=A'@C’; 
(3) A@(C+D)=A®C+AQD; 
(4) (A @C)(F @ G) = (AF) & (CG); 
(5) 如 果 A 与 C TXH, U (AS C)?! =A 8 C785 
(6) 对 方 阵 A 和 C, tr(A @ C) = tr(A)tr(C); 
(7) vec(A + C) = vec(A) + vec(C); 
(8) vec(ABC) = (C' & A)vec(B); 
(9) tr AC) = vec(C")'vec( A) = vee(A’)/vec(C); 
(10) tr(ABC) = vec( A')'(C' ® I)vec(B) = vee(A’)'(I & B)vec(C) 
= vec( B''( A' & I)vec(C) = vec( B^) (I & C)vec( A) 
= vec(C")' (B' & I)vec( A) = vec(C")' (I & A)vec( B). 
在 多 元 统计 分 析 中 , 我 们 经 常 处 理 对 称 和 矩阵 . 因此 , 可 以 很 方便 地 将 拉 直 算 子 
推广 为 半 拉 直 算 子 , 它 包含 了 主 对 角 线 或 其 以 下 的 元 素 . 具体 地 , 对 一 个 对 称 方 阵 
A = [ai;]kxx, 定义 


vech( A) = (a . 5... ui i aL.) 
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其 中 ai 是 A 的 第 一 列 , ai. = (aii, aisi pani)! 是 (k—i4-1) 维 向 量 . vech(A) 的 
维 数 是 k(k+1)/2. 例如 , 假设 大 = 3, 则 我 们 有 veeh(A) = (aiiyaziyaaiyazzyaszyaaa))， 
它 是 一 个 6 维 向 量 . 


附录 B 多 元 正 态 分 布 


一 个 上 维 随机 向 量 m = (21, nx)! 服从 均值 pp = (ya, >>, ee)’, 正定 协 方差 
AREE D 一 [oi] HETESI, 如 果 它 的 概率 分 布 密度 函数 (pdf) 为 


1 1 
f(z|p, £) = E exp -9(* — uy € !(z— p)|. (8.46) 


我 们 利用 记号 rz ~ Na(u X) 表示 m 服从 这 样 一 个 分 布 . 正 态 分 布 在 多 元 统计 分 
析 中 起 着 很 重要 的 作用 , 它 有 几 个 很 好 的 性 质 . 这 里 仅 考虑 与 我 们 的 研究 有 关 的 性 
质 . 对 具体 内 容 感 兴趣 的 读者 可 以 参见 Johnson 和 Wichern(1998). 

为 了 深入 了 解 多 元 正 态 分 布 , 考虑 二 元 情形 ( 取 k= 2). 在 这 种 情形 下 , 我 们 有 


n= | E pole 1 | 722 be st 

7012 022 011022 —012 | —012 11 

利用 相关 系数 p = o12/(o102), 这 里 mi = Voi 是 xi 的 标准 差 , 我 们 有 ow = 
py/011722 且 || = e11022(1 — p°), W ac 的 概率 密度 函数 变 为 


1 1 
f (x1, z2|u, 2) = ic exp say lee =) i 


Ti 一 Z9 一 Z1 -4 T9 — 
其 中 Qem E) = ( 5) á ( =t) -2p( us : ( EAD, 
Johnson 和 Wichern(1998) 的 第 4 章 包含 了 这 种 概率 密度 函数 的 一 些 图 形 . 
令 c= (c1,… ,ck) 是 一 个 非 零 的 上 维 向 量 . 将 随机 向 量 分 块 为 z= (m5, 5)’, 
其 中 zi = (T1; Ep), T2 = (Eppie tk) 1S p< k. 相应 地 ,将 jy AD € 


块 得 到 
alale ED 
T2 Ho X2 22 

z 具有 如 下 性 质 ， 

(1) cz ~ N(c'u,c'Ec). 就 是 说 , c 的 任何 非 零 线性 组 合 是 一 元 正 态 的 . 这 个 
性 质 反 过 来 也 成 立 . 具体 地 , 如 果 对 任何 非 零 向 量 c, cz 是 一 元 正 态 的 , 则 n 是 多 
元 正 态 的 . 

(2) a, 的 边际 分 布 是 正 态 的 . 事实 上 , Mi = 1 和 2, zi — Nx (i; Du), 其 中 
ky = p, ko — k— p. 
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(3) Di2 = 0 当 且 仅 当 a, 与 ae 独立. 
(4) 随机 变量 y= (m 一 pj) 区 (zx — u) 服从 自由 度 为 m 的 x? 分 布 . 
(5) zi 在 给 定 zz =b 下 的 条 件 分 布 也 是 正 态 的 , 即 


(zilzz = b) ~ Nolpi + 1257 (b — wg), i1 — 129252 Eni]. 


最 后 一 个 性 质 在 许多 科学 领域 都 很 有 用 . 例如 , 它 形成 了 正 态 假定 下 的 时 间 序 列 预 
测 与 递 推 最 小 二 乘 估计 的 基础 . 


附录 C 一些 SCA 命令 
下 面 的 SCA 命令 是 在 例 8.6 的 分 析 中 用 到 的 . 


input x1,x2. file ‘m-gsin3-5301.txt’ $ Load data 


rl-ln(x1l) $% Take log transformation 


r2=1n (x2) 
miden r1,r2. no ccm. arfits 1 to 8. 
-- $ Denote the model by v21. 
mtsm v21. series rl,r2. @ 
model (i-pl*b-p2*b**2) series=c+ (i-t1*b) noise. 


mestim v21. % Initial estimation 


pi(2,1)=0 % Set zero constraints 


cpl (2,1)=1 


cp2(2,1)=1 


p2(2,2)=0 


cp2(2,2)=1 


ti (2,1)=0 


ct1(2,1)=<1 
- % Refine estimation and store residuals 
mestim v21. method exact. hold resi (res1,res2) 


miden resl,res2. 
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练 2] 题 


8.1 考虑 Merck & Company, Johnson & Jonhson, General Electric, General Motors, Ford 
Motor Company 以 及 价值 加 权 指 数 从 1960 年 1 HÆ 1999 年 12 月 以 百分比 表示 的 月 
对 数 股票 收益 率 , 包括 了 红利 支付 . 见 文件 m-mrk2vw.txt. ESA 6 WAM aT 
列 的 次 序 一 致 . 
(a) 计算 数据 的 样本 均值 、 样 本 协 方差 矩阵 以 及 样本 相关 和 矩阵 . 
(b) 检验 零 假 设 Ho : p, = = ps — 0, 其 中 o, 为 数据 的 延迟 的 交叉 相关 矩阵 , 基于 

5 久 显 闭 水 平 推出 结论 . 

(c) 这 6 个 收益 率 序列 间 有 引导 -延迟 关系 吗 ? 

8.2 Æ. 路易斯 联邦 储备 银行 在 它 网 页 上 出 版 所 选择 的 利率 及 美国 的 金融 数据 , 网 址 是 : 


http://research.stlouisfed.org/fred2/. 


考虑 固定 期 限 为 1 年 和 10 年 的 国库 券 的 月 利率 , 时 间 从 1953 年 4 月 至 2000 年 10 月 

Jt 571 个 观测 值 ; 见 文 件 m-gelniO.txt. 利率 是 用 百分比 表示 的 . 

(a) & e —r«— ra 为 月 利率 m, 的 变化 量 序列 . 对 两 个 变化 量 序列 构造 一 个 二 元 自 回 
归 模 型 . 讨论 模型 所 蕴含 的 意义 , 并 将 模型 转换 为 结构 形式 . 

(b) 对 两 个 变化 量 序列 建立 一 个 二 元 滑动 平均 模型 . 讨论 这 个 模型 所 蕴含 的 意义 , 并 与 前 
面 的 二 元 AR 模型 的 结果 比较 . 

8.3 再 次 考虑 固定 期 限 为 1 年 和 10 年 的 国库 券 的 月 利率 , 时 间 从 1953 年 4 H 48 2000 年 10 
ASE 571 个 观测 值 . 考虑 数据 的 对 数 序列 , 并 对 序列 建立 一 个 VARMA 模型 .讨论 所 得 
模型 蕴含 的 意义 . 

8.4 再 次 考虑 固定 期 限 为 1 年 和 10 年 的 国库 券 月 利率 , 时 间 从 1953 年 4 月 至 2000 年 10 月 

共 571 个 观测 值 . 这 两 个 利率 序列 是 门限 协 整 的 吗 ? 利用 利 差 ss = riot — rie 作为 门限 

变量 , 其 中 rit RRA RERI i FHESA. 如 果 它 们 是 门限 协 整 的 , 对 两 个 序列 建立 

一 个 多 元 门限 模型 , 

二 元 AR(4) 模型 z, — $41, 4 = by 十 at 是 一 个 周期 为 4 的 特殊 季节 模型 , {at} 是 独立 

同 分 布 的 正 态 随机 变量 序列 , 均值 为 0, 协 方差 矩阵 为 X. 这 种 季节 模型 在 研究 公司 的 季 

度 收入 时 可 能 有 用 . 

(a) 假设 zt 是 弱 平 稳 的 , 试 推导 zt 的 均值 向 量 与 协 方差 矩阵 . 

(b) 推导 z, 弱 平 稳 性 的 充分 必要 条 件 . 

(c) 证 明 对 / > 0, T; — Ty 4, HT, 是 me 的 延迟 为 的 自 协 方差 矩阵 . 

8.6 二 元 MA(4) 模型 m, = ar- Osara 是 周期 为 4 的 另 一 个 季节 模型 , {a,} 是 独立 同 分 布 

的 正 态 随机 变量 序列 , 均值 为 0, 协 方差 矩阵 为 X. 试 对 2 = 0,… ,5, 推导 zt 的 协 方差 

矩阵 Te. 

考虑 固定 期 限 为 1 年 和 3 年 的 美国 国库 券 1953 年 4 月 至 2004 年 3 月 的 月 利率 , 数据 可 

以 从 圣 . 路 易 斯 联邦 储备 银行 或 者 文件 m-gs1n3-5304.txt (1 年 期 和 3 年 期 数据 ) 获得 . 

也 可 以 参见 例 8.6, 其 中 它 利 用 了 一 个 更 短 的 时 间 区 间 . 这 里 我 们 直接 利用 利率 序列 而 不 

作对 数 变换 . 定义 zt = (zlyzat) 其 中 ri 是 一 年 期 利率 , zat 是 3 年 期 利率 . 

(a) 为 该 二 元 利 淮 序 列 识别 一 个 VAR 模型 , 并 写 下 所 拟 合 的 模型 . 


8. 


cQ 


8. 


~ 
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(b) 计算 所 拟 合 VAR 模型 的 脉冲 响应 申 数 . 用 前 6 个 延迟 值 就 足够 了 . 

(c) 利用 所 拟 合 的 VAR 模型 计算 利 举 序列 的 向 前 1 步 到 向 前 12 步 预 测 ， 预测 原点 为 
2004 年 3 月 . 

(d) 当 利 用 一 个 带 限 制 的 常数 项 时 , 这 两 个 利率 序列 是 协 整 的 吗 ? 在 5% 的 显著 水 平 下 进 
行 检验 . 

(e) 如 果 序 列 是 协 整 的 , 给 序列 建立 一 个 ECM 模型 , 并 写 下 所 拟 合 的 模型 . 

(f) 利用 所 拟 合 的 ECM 模型 计算 利率 序列 的 向 前 1 步 到 向 前 12 步 预 测 , 预测 原点 为 
2004 年 3 月 . 


(g) 比较 分 别 由 VAR 模型 和 ECM 模型 所 得 到 的 预测 . 
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9893 主 成 分 分 析 和 因子 模型 


许多 金融 组 合 包含 多 个 资产 , 它们 的 收益 率 同时 并 动态 地 依赖 于 许多 经 济 和 人 金 
融 变量 .因此 利用 合理 的 多 元 统计 分 析 方 法 来 研究 组 合 收益 率 的 行为 和 性 质 很 重 
要 . 然而 , 如 前 几 章 所 述 , 对 多 元 资产 收益 率 的 分 析 通 常 需要 高 维 统计 模型 , 而 这 些 
模型 很 复杂 并 且 很 难 应 用 . 为 了 使 多 元 收益 率 的 建 模 更 加 简单 , 本 章 讨 论 一 些 降 低 
维 数 的 方法 来 寻找 这 些 资产 的 内 在 结构 . 一 般 来 说 , 降低 维 数 最 常用 的 统计 方法 是 
主 成 分 分 析 (PCA). 我 们 的 讨论 也 从 该 方法 开始 . 实际 中 所 观测 到 的 收益 率 序列 通 
常 呈现 出 相似 的 特征 , 这 使 得 人 们 相信 和 它们 是 由 共同 的 因素 驱动 的 . 这 些 共同 的 因 
素 称 为 公共 因子 . 为 了 研究 资产 收益 率 的 共同 形式 和 简化 组 合 分 析 , 许多 文献 给 出 
了 很 多 因子 模型 来 分 析 多 元 资产 收益 率 . 本 章 的 第 二 个 目的 是 引进 一 些 有 用 的 因子 
模型 , 并 说 明 它 们 在 金融 中 的 应 用 ， 

有 三 种 类 型 的 因子 模型 可 用 来 研究 资产 收益 率 . 参见 Connor(1995) 与 Camp- 
bell, Lo 和 MacKinlay(1997). 第 一 种 类 型 是 宏观 经 济 因子 模型 . 该 模型 利用 宏观 经 
济 变量 来 描述 资产 收益 率 的 共同 的 行为 , 其 中 , 这 些 宏观 经 济 变 量 包括 GDP 增长 
率 、 利 率 、 通 货 膨 胀 率 以 及 失业 人 数 等 ， 由 于 该 类 模型 的 因子 可 以 观测 ， 从 而 可 以 
利用 线性 回归 的 方法 来 估计 模型 . 第 _ 种 类 型 是 基本 面 因子 模型 . 该 类 模型 用 企业 
或 资产 的 具体 属性 来 构建 公共 因子 . 例如 企业 规模 、 账 面 价值 与 市 场 价值 以 及 产业 
分 类 . 第 三 种 类 型 是 统计 因子 模型 . 该 类 模型 把 公共 因子 看 成 是 需要 用 收益 率 序 列 
估计 的 不 可 观测 的 变量 或 绚 变 量 . 本 章 将 讨论 这 三 类 因子 模型 以 及 它们 在 金融 中 
的 应 用 . Alexander (2001) 与 Zivot 和 Wang (2003) 也 讨论 了 资产 收益 率 的 主 成 分 
分 析 和 因子 模型 . 

本 章 的 结构 安排 如 下 : 9.1 节 介 绍 资产 收益 率 的 一 般 因子 模型 ; 9.2 节 讨论 宏观 
经 济 因子 模型 并 给 出 一 些 简单 的 例子 ; 基本 面 因子 模型 及 其 应 用 在 9.3 节 中 给 出 ; 
9.4 节 介 绍 统 计 因 子 分 析 最 基本 的 方法 一 一 主 成 分 分 析 (在 多 元 分 析 中 它 是 用 来 
降低 维 数 的 ); 9.5 节 讨 论 正 交 因子 模型 , 包括 因子 旋转 及 其 估计 , 并 给 出 了 例子 ; 最 
后 , 9.6 节 介 绍 渐 近 主 成 分 分 析 . 


9.1 因子 模型 


假定 有 上 大 个 资产 和 了 个 时 间 周 期 . ri 表示 资产 i 在 第 t 个 时 间 周期 内 的 收益 . 
因子 模型 的 一 般 形 式 为 


0 二 二 十 C= i-1,--,k, (9.1) 
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其 中 o; 是 常数 表示 截 距 , {felj = 1,… ,m} 是 m 个 公共 因子 , 8, 是 资产 i 在 因 
T j ERTH, sx 是 资产 i 的 个 性 因子 . 
对 于 资产 收益 率 , 假定 因子 f, = (Fuss , fm) 是 m 维 平稳 过 程 , 满足 


E = (fi)= pp 
COv(f,)=Zy, mx m FRR. 


资产 的 个 性 因子 si 是 白 噪声 序列 , 并 且 与 公共 因子 fj, 和 其 他 个 性 因子 不 相关 . 具 
体 地 , 我 们 假定 


E(si)=0, 所 有 的 i 和 5 
Cov(fa.s;.)—0, 所 有 的 j,i, t Ñ s, 
2 Pls x x. 

Cov (Eit, Ejs) -{ h l oa per 
因此 , 公共 因子 与 个 性 因子 不 相关 , 并 且 个 性 因子 之 间 也 是 不 相关 的 . 然而 在 一 些 
因子 模型 中 并 不 要 求 公共 因子 之 间 是 不 相关 的 . 

在 某 些 应 用 中 , 资产 的 个 数 上 可 能 比 时 间 周 期 的 个 数 T 大. 我 们 将 在 9.6 节 分 
析 这 样 的 数据 . 在 因子 分 析 中 通常 假定 因子 之 间 是 序列 不 相关 的 , 从 而 re 也 是 序 
列 不 相关 的 . 在 应 用 中 , 如 果 观 测 到 的 收益 率 序列 是 序列 相关 的 , 则 可 以 用 第 8 章 
的 模型 消除 序列 相关 性 . 

(9.1) 式 的 因子 模型 可 以 写成 下 述 矩 阵 形式 : 


rit = ai + Pift t Eit: 
其 中 B; = (Bi, +++ Bim)’, t SAI k SEF IRA BL 
Tr, =a+Bf,+e, t=—1,---,T, (9.2) 


其 中 ri = (Pit , tee)’, B= (8;;] Æ k x m 因子 负荷 矩阵 , et = (el4,… 5 ene)! 是 
误差 向 量 且 Cov(e;) = D = diag{o?,--- ,02} 是 上 x 上 对 角 和 矩阵 ， 从 而 , 收益 率 m, 
的 协 方差 矩阵 为 
Cov(r;) = 8X,8' + D. 
如 果 因 子 fj, 是 可 以 观测 的 , 则 (9.2) 式 的 这 种 模型 表示 具有 横 截面 回归 的 形式 ， 
把 (9.1) 式 的 因子 模型 看 作 时 间 序 列 , 对 第 i 个 资产 我 们 有 


Ri = ajlr+ Fp; + Ei, (9.3) 


其 中 Ri = (ri rir), i= 1, ,k, Ir 是 所 有 元 素 都 为 1 的 了 维 向 量 , P 是 
T x m 矩阵 且 其 第 + 行 是 fA, By = (sa eer). E; 的 协 方差 矩阵 Cov(E;) = o?I 
ET xT HAR. 


最 后 , (9.2) 式 可 改写 为 
Tt = Êg, + €t, 
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其 中 g, = (1, fi)’, € = [a, p] HE k x (m1) 矩阵 . 对 上 式 取 转 置 并 把 所 有 的 数据 放 
在 一 块 , 则 可 以 得 到 
R — G£' +E, (9.4) 


其 中 OR fe T x k KARERE, 其 第 t 行 是 x/, 或 等 价 地 其 第 i 列 是 由 (9.3) 式 定义 
的 Ri; G ÆT x (m--1) 和 矩阵, 其 第 t 行 是 gl; BET x k MERTER., 其 第 
行 是 ei. 如 果 公 共 因 子 f, 可 以 观测 , 则 (9.4) 式 是 多 元 线性 回归 模型 (MLR) 的 一 
种 特殊 形式 . 参见 Johnson 和 Wichern (2002). 对 于 一 般 的 MLR 模型 , 不 要 求 e, 
的 协 方差 矩阵 是 对 角 阵 . 


9.2 ”宏观 经 济 因子 模型 


由 于 宏观 经 济 因 子 模型 中 的 因子 是 可 以 观测 的 , 从 而 可 以 利用 最 小 二 乘 方法 来 

估计 (9.4) 式 的 MLR 模型 . 估计 为 

= [2 = (G'G) (G' R), 
从 中 可 以 很 容易 地 得 到 a 和 B 的 估计 . (9.4) 式 的 残 差 为 

E-R-GÉ. 

基于 对 模型 的 假定 , e, 的 协 方差 矩阵 可 以 由 下 式 估计 : 

D = diag(B E/(T — m — 1)), 
其 中 diag(4) 表示 由 矩阵 A 的 对 角 线 元 素 所 构成 的 对 角 和 矩阵 ， 进 一 步 地 , (9.3) 式 
中 第 i 个 资产 的 R? 为 


[E E]; 


R-square, — 1 IR'R),. 


P—1,e 2K; 


其 中 A;; 表示 和 矩阵 A 的 第 (i, i) 元 . 

注意 到 先前 的 估计 并 没有 要 求 个 性 因子 i 彼此 不 相关 . 因此 一 般 来 说 所 得 到 
的 估计 不 是 有 效 的 . 然而 加 上 正 交 化 限制 经 常 需要 大 量 的 计算 , 而 且 通 常 是 可 以 忽 
略 的 . 我 们 可 以 检查 E E/(T -m1) 的 非 对 角 线 元 素来 验证 所 拟 合 模型 的 充分 
性 . 
9.2.1 AFRE 


金融 中 最 著名 的 宏观 经 济 因子 模型 是 市 场 模型 ， 参见 Sharpe (1970). 该 市 场 
模型 就 是 下 述 单 因子 模型 : 


Ta =0Qit hirm 二 51 (9.5) 
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其 中 ra 是 第 i 个 资产 的 超额 收益 率 , rw 是 市 场 的 超额 收益 率 . 为 了 进一步 说 明 ， 
考虑 13 只 股票 的 月 收益 率 并 日 把 S&P500 指数 的 收益 率 作为 市 场 收 益 率 . 表 9-1 
给 出 了 所 用 到 的 股票 及 其 代码 . 样本 区 间 是 从 1990 年 1 月 到 2003 年 12 月 , 因此 
k —13,T — 168. 我 们 利用 二 级 市 场 上 的 三 个 月 期 国库 券 的 月 收益 作为 无 风险 利率 
来 计算 股票 和 市 场 指数 的 超额 收益 . 这 些 收益 率 均 以 百分比 的 形式 给 出 ， 


表 9-1 单 因 子 模型 分 析 中 所 用 到 股票 及 其 代码 * 


Company 


Company 


AA Alcoa 1.09(9.49) KMB Kimberly-Clark 0.78(6.50) 
AGE A.G.Edwards 1.36(10.2) MEL Mellon Financial 1.36(7.80) 
CAT Caterpillar 1.23(8.71) NYT New York times 0.81(7.37) 
F Ford Motor 0.97(9.77) PG Procter&Gamble 1.08(6.75) 
FDX FedEx 1.14(9.49) TRB Chicago Tribune 0.95(7.84) 
GM General Motors 0.64(9.28) TXN Texas Instrument 2.19(13.8) 


Hewlett-Packard ^ — 1.37(0.42) S&P500 index 0.42(4.33) 
a 表 中 还 给 出 了 超额 收益 率 的 样本 均值 和 样本 标准 差 ， 样本 区 间 是 从 1990 年 1 月 到 2003 年 12 A. 


我 们 用 S-Plus 来 执行 上 一 小 节 所 讨论 的 估计 方法 . 所 用 的 大 部 分 命令 都 能 在 
免费 软件 R 中 应 用 . 


> da-matrix(scan(file-'m-fac9003.txt'),14) 
> x=t (da) 

> xmtx=cbind(rep(1,168) ,x[,14]) 

> rtn-x[,1:13] 

> xit.hat-solve(xmtx,rtn) 

> beta.hat-t(xit.hat[2,]) 
> 
> 
> 


E.hat-rtn-xmtx$&*$xit.hat 
D.hat=diag (crossprod(E.hat) / (168-2) ) 
r.square-1-(168-2)*D.hat/diag(var(rtn,SumSquares-T)) 
t (rbind (beta-hat,sqrt (D.hat),r.square) ) 

beta.hat sigma(i) r.square 


AA 1.292 7.694 0.347 
AGE 1.514 7.608 0.415 
CAT 0.941 7.725 0.219 

F 1.219 B.241 0.292 
FDX 0.805 8.854 0.135 

GM 1.046 8.130 0.238 
HPQ 1.628 9.469 0.358 
KMB 0.550 6.070 0.134 
MEL 1.123 6.120 0.388 
NYT 0.771 6.590 0.205 

PG 0.469 6.459 0.090 
TKB 0.718 7.215 0.157 
TXN 1.796 11.474 0.316 


下 面 给 出 了 第 ;个 资产 收益 率 的 B;,0? 和 R 的 估计 . 
9-1 给 出 了 13 只 股票 B, 和 R? 的 条 形 图 . 金融 股票 AGE 和 MEL 以 及 高 
科技 股票 HPQ 和 TXN 似乎 有 较 高 的 8 和 R. 另 一 方面 , KMB 和 PG 有 较 低 的 
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B 和 m^. R? 的 变化 范围 是 从 0.09 到 0.41. 这 表明 市 场 收 益 对 每 只 股票 变化 的 解 
释 少 于 5096. 


(a) 3 


AA AGECAT F FDX GM HPQKMB MELNYT PG TRB TXN 


(b) æ 
0.4 


0.3 
0.2 
0.1 
0.0 


AA AGECAT F FDX GM HPQKMBMELNYT PG TRBTXN 


图 9-1 对 13 只 股票 的 月 超额 收益 拟 合 单 因子 模型 时 B 和 R? 的 条 形 图 : (a) 8 的 条 形 图 ; (b) 
R? ARICA. S&P500 指数 的 超额 收益 率 作为 市 场 指数 . 样本 区 间 是 从 1990 年 1 月 
到 2003 年 12 A 


在 市 场 模型 中 , rt 的 协 方差 矩阵 和 相关 和 矩阵 可 以 如 下 估计 ; 


> cov.r=var (x[,14])*(t(beta.hat)%*tbeta.hat)+diag(D.hat) 
> sd.r=sqrt (diag(cov.r)) 

> corr.r=cov.r/outer(sd.r,sd.r) 

> print (corr.r,digits=1,width=2) 


AA 
AGE 


AR AGE CAT F FDX GM HPQ KMB MEL NYT PG TRB TXN 
21,0 0.4 0.3 0.3 0.2 0.3 0.4 0.2. D.4 0.3 0270.2: 0.3 
0.4 1.0 0.3 0.3 0.2 0.3 0.4 0.2 0.4 0.3 0.2 0.3 0.4 
0.3 0.3 1.0 0.3 0.2 0.2 0.3 0.2 0.3 0,2 0.1 0.2 0.3 
0.3 0.3 0.3 1.0 0.2 0.3 0.3 0.2 0.3 0.2 0.2 0.2 0.3 
0.2 0.2 0.2 0.2 1.0 0.2 0.2 0.1 0.2 0.2 0.1 0.1 0.2 
0.3 0:3 0.2 0;3. 0.2 1.0 0.3 0.2 013 0:2 0.1 0.2 0.3 
0.4 0.4 0.3 0.3 0.2 0.3 1.0 0.2 0.4 0.3 0.2 0.2 0.3 
0.2 0.2 0.2 0.2 0.1 0.2 0.2 1.0 0.2 0.2 0.1 0.1 0.2 
0.4 0.4 0.3 0.3.0.2 0.3 0.4 0.2 1,0 0.3 0.2 0.2 0,3 
0.3 0,3 0.2 0,2 0.2 O72 0.3 0.2. 0.3. 1.0 0.1 0.2 0.3 
0.2 0.2 0.1 0.2 0.1 0.1 0.2 0.1 0.2 0.1 1.0 0.1 n.2 
0,2 0.3 0.2 0.2 0.1 0.2 0.2 0.1 0.2 0.2 0.1 1.0 0.2 
0.3 0.4 0.3 0.3 0.2 0.3 0.3 0.2 0.3 0.3 0.2 0.2 1.0 


我 们 可 以 将 所 估计 的 超额 收益 率 的 协 方差 矩阵 和 相关 和 拢 阵 与 其 样本 协 方差 矩 
阵 和 样本 相关 和 矩阵 进行 比较 . 
> print (cor (rtn) ,digits=1,width=2) 


AA AGE CAT F FDX GM HPQ KMB MEL NYT PG TRB TXN 
AA 1.0 0.3 0.6 0.5 0.2 0.4 0.5 0.3 0.4 0.4 0.1. 0.3 0.5 
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0.3 1.0 04.3 0.3 0,3 0.3 03 TF 0.4 0.4 0.2 0.2: 0:3 

CAT 0.6 0.3 1.0 0.4 0.2 0.3 0.2 0.3.0.4 0.3 0.1 0.4 0.3 
F 09.5 0.3 0.4 1.0 0.3 0.6 0.3 0.3. 0.4 60.4 DET 0.3. 0.3 
FDX 0.2: 0:3 O82 0;3 43.0 0:2. 0:3 073:0:2 0.2, DiI 0.3. 0.2 
GM 0.4 0.3 0.3 0.5 0.2 1.0 0.3 0.3 0.4 0.2 0.1 0:3 0.3 
HPQ.0.5 0,3 0.2 0.3 0.3 0.3: 1.0 0.1 0.3 0.3.0.1 0.2 0.56 
EMR 0.3: 0.3.0.3 0.2, 0.3 0.3) 0.1 1.0, 0.3 0.2: 0.3 0.3) 0.1 
MEL 0.4 0.4 0.4 0.4 0.2 0.4 0.3 0.4 1.0 0.3 0.4 0.3 0.3 
NYT 0,4: OF 0,3 0.4.0.3 0.2. 0,3 0.2. 0.3 21.0: 0;2 0.5 0.2 
PG 0.l 0.2 0.X 0.1.0.1 0.1.0.1 0.3 0.4 0.2 1.0 0.3: O52 
TRB: 0.3: /0,2. 0,4 0,3: 0;3 0.3: D;2 0.3: 0,3 Va 0.3 1.0. 0.2 
TSN, 0.5 0,3 0.3 0.3.0.2 0.3. 0.6 0.41 0.3 0.2 0.1 0.2 1.0 


在 金融 中 , 可 以 利用 全 局 最 小 方差 组 合 (GMVP) 来 比较 给 收益 率 所 拟 合 因子 
模型 的 协 方差 矩阵 与 收益 率 的 样本 协 方差 矩阵 . 对 于 给 定 的 协 方差 矩阵 X, 全 局 最 
小 方差 组 合 w 是 下 述 最 优化 问题 的 解 : 


minc? o =w Dw, 满足 w1-i1. 
人 


解 之 可 得 
$3 
"FST 
其 中 1 是 元 素 全 为 1 的 大 维 向 量 . 
对 于 所 考虑 的 市 场 模型 , 所 拟 合 模型 和 数据 的 GMVP 如 下 : 


> w.gmin.model-solve(cov.r)$*$*rep(1,nrow(cov.r)) 
> w.gmin.model-w.gmin.model/sum(w.gmin.model) 
> t(w.gmin.model) 


AA AGE CAT F FDX GM 
[1,] 0.0117 -0.0306 0.0792 0.0225 0.0802 0.0533 
HPQ KMB MEL NYT PG TRB TXN 


[1,] -0.0354 0.2503 0.0703 0.1539 0.2434 0.1400 -0.0388 
> w.gmin.data-solve(var(rtn))$*&rep(1,nrow(cov.r)) 

> W.gmin.data=w.gmin.data/sum(w.gmin.data) 

> t(w.gmin. data) 


AA AGE CAT F FDX GM 
[1,] -0.0073 -0.0085 0.0866 -0.0232 0.0943 0.0916 
HPQ KMB MEL NYT PG TRB TXN 


[1,] 0.0345 0.2296 0.0495 0.1790 0.2651 0.0168 -0.0080 


比较 两 个 GMVP, 给 予 TRB 股票 的 权重 变化 很 大 . 然而 , 这 两 个 组 合 都 给 予 
KMB, NYT 和 PG 股票 较 大 的 权重 . 

最 后 我 们 检查 残 差 的 协 方差 矩阵 和 相关 矩阵 以 验证 13 只 股票 的 个 性 因子 不 相 
关 的 假定 . 下 面 给 出 了 残 差 相 关 和 矩阵 的 前 四 列 , 且 在 残 差 的 交叉 -相关 和 矩阵 中 有 了 到 
较 大 值 的 元 素 , 例如 Cor(CAT,AA) = 0.45 和 Cor(GM,F) = 0.48. 


resi.cov=t (E.hat) t*tE.hat/ (168-2) 
resi.sd=sqrt (diag(resi .cov) ) 
resi.cor=resi.cov/outer(resi.sd,resi.sd) 
print (resi.cor,digits=1,width=2) 


vvv v 
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AA 1.00 -0.13 0.45 0.22 
AGE -0.13 1.00 -0.03 -0.01 
CAT 0.45 -0.03 1.00 0.23 

F 0.22 -0.01 20.23 1.00 
FDX 0.00 0.14 0.05 0.07 

GM 0.14 -0.09 0.15 0.48 
HPQ 0.24 -0.13 -0.07 -0.00 
KMB 0.16 0.06 0.18 0.05 
MEL -0.02 0.06 0.09 0.10 
NYT 0.13 0.10 0.07 0-19 

PG -0.15 -0.02 -0.01 -0.07 
TRB 0.12 -0.02 0.25 0.16 
TXN 0.19 -0.17 0.09 -0.02 


9.2.2 ”多 因子 模型 


Chen, Roll 和 Ross(1986) 考虑 了 股票 收益 率 的 多 因子 模型 . 所 用 的 因子 包括 
宏观 经 济 变量 的 不 可 预知 的 变化 或 意外 ， 这 里 不 可 预知 的 变化 表示 移 除 宏 观 经 济 
变量 动态 依赖 后 所 得 到 的 残 差 . 得 到 不 可 预知 的 变化 的 一 个 简单 方法 是 为 宏观 经 
济 变量 拟 合 一 个 第 8 章 中 的 VAR 模型 . 为 了 进一步 说 明 , 考虑 下 列 两 个 月 宏观 经 
济 变 量 . 

(1) 城市 居民 的 消费 价格 指数 (CPI): 包括 所 有 项 的 指数 , 且 指 数 1982 — 1984 — 
100. 

(2) 16 年 及 以 上 城市 就 业 人 数 (CE16): 以 千 记 . 

CPI 和 CE16 都 已 经 进行 了 季节 调整 ， 数据 的 时 间 区 间 是 从 1975 年 1 月 到 2003 
年 12 H. 我 们 用 更 长 的 时 间 区 间 来 得 到 变量 的 意外 序列 . 对 于 这 两 个 序列 , 我 们 
通过 取 对 数 序 列 的 一 阶 差 分 爸 造 增长 率 序列 . 增长 率 序列 以 百分比 的 形式 给 出 . 

为 了 得 到 意外 序列 , 我 们 用 BIC 准则 来 识别 VAR(3) 模型 . 这 样 , 因子 模型 中 
所 用 的 这 两 个 宏观 经 济 因子 都 是 对 数据 拟 合 VAR(3) 模型 时 从 1990 年 到 2003 年 
的 残 差 . 对 于 超额 收益 率 序 列 , 我 们 仍然 考虑 前 面 所 用 到 的 13 只 股票 . 下面 给 出 
了 分 析 的 细节 : 


da=matrix (scan (file='m-cpicel6é-dp7503.txt’) ,2) 
cpi=da[1,] 
cen=da[2,] 
xl=cbind (cpi, cen) 
yl=data. frame (x1) 
ord.choice-VAR(y1,max.ar-13) 
ord.choice$info 
ar(1) ar(2) ar (3) ar (4) ar (5) ar (6) 
BIC 36.992 38.093 28.234 46.241 60.677 75.810 


Vv 


VV V V V V 


ar(7) ar(8) ar(9) ar(10) ar(11) ar(12) ar(i3) 
BIC 86.23 99.294 111.27 125.46 138.01 146.71 166.92 
> var3.f£it=VAR(xl~ar(3)) 
> res-var3.fit$residuals[166:333,1:2] 
> da-matrix(scan(file-'m-fac9003.txt'),14) 


360 第 9 章 主 成 分 分 析 和 因 了 于 模型 


xmtx = cbind(rep(1,168),res) 

da=t (da) 

rtn=da[,1:13] 

xit.hat-solve (xmtx,rtn) 

beta.hat-tí(xit.hat|[2:3,]) 

E.hat-rtn - xmtx%*txit.hat 

> D.hat=diag(crossprod(E.hat) / (168-3) ) 

> r.Bquare-1-(168-3)*D.hat/diag(var(rtn,SumSquares-T)) 


9.2 给 出 了 13 只 股票 的 8 和 R? 估计 的 条 形 图 . 有 趣 的 是 , 所 有 的 超额 收 
MEG CPI 增长 率 的 不 可 预知 的 变化 都 是 负 相 关 的 . 这 看 起 来 是 合理 的 . 然而 , 所 
有 超额 收益 率 的 n? 都 很 低 , 这 说 明 这 两 个 宏观 经 济 变量 对 这 13 只 股票 超额 收益 


率 的 解释 能 力 很 低 . 
CPI PF ff) beta CEP16 意 外 的 beta rR 


We RM aA IM 


E & L- T- ba 4. A f T T 1 | T T | 
:14-12-10-8 -6-4 —2 0 -4 -2 0 2 0.0 0,02 004 0.06 


图 92 对 13 只 股票 的 月 超额 收益 率 拟 合 二 因子 模型 时 3 和 R^ 的 条 形 图 ， 样 本 区 间 是 从 
1990 年 1 月 到 2003 年 12 月 


用 下 面 的 命令 可 以 得 到 该 二 因子 模型 的 协 方差 矩阵 和 相关 和 矩阵 的 估计 : 
> cov.rtn-beta.hatt*tvar(res)**&t(beta.hat) diag(D.hat) 

> sd.rtn=sqrt (diag(cov.rtn)) 

> cor.rtn = cov.rtn/outer(sd.rtn,sd.rtn) 

> print (cor.rtn,diits+1,width=2) 


HIEREN BOE FAMER, 表明 所 用 的 二 因子 模型 并 不 能 很 好 地 拟 合 这 些 
超额 收益 率 . 最 后 , 下 面 给 出 二 因子 模型 残 差 的 相关 和 矩 阵 , 


> cov.resi=t(E.hat)%*%tE.hat/ (168-3) 

> sd.resi=sqrt (diag(cov.resi) ) 

> cor.resi-cov.resi/outer(sd.resi,sd.resi) 
> print (cor.resi,digits=1,width=2) 
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如 所 料想 , 该 相关 算 阵 非常 接近 于 前 而 由 原始 超额 收益 率 序列 给 出 的 相关 算 
We, 故此 处 略 去 . 


9.3 ”基本 面 因子 模型 


基本 而 因子 模型 用 资产 的 可 观测 的 具体 属性 构建 公共 因子 来 解释 超额 收益 率 . 
这 些 具体 属性 包 插 产业 分 类 、 企 业 规 模 、 市 场 资 本 化 、 账 面 价值 以 及 风格 分 类 ( 增 
长 率 或 值 ). 对 于 基础 因子 模型 , 文献 中 有 两 种 方法 . 第 一 种 方法 是 由 BARRA 公司 
的 创立 者 Bar Rosenberg 提出 的 , 称 为 BARRA 方法 . 参见 Grinold 和 Kahn(2000). 
与 宏观 经 济 因子 模型 相反 , 该 方法 将 观测 到 的 资产 的 具体 基本 面 作为 因子 B,, 在 每 
个 时 刻 上 通过 回归 的 方法 估计 因子 fe beta 不 随时 间 改 变 , 但 是 sf, 随时 间 演 变 . 第 
二 种 方法 是 由 Fama 和 French(1992) 提出 的 Fama—French 方法 . 在 该 方法 中 , XJ 
于 给 定 的 具体 基本 面 , 通过 基于 该 具体 基本 面 构造 对 冲 组 合 来 得 到 因子 fy. 下面 
两 小 节 中 , 我 们 简要 讨论 一 下 这 两 种 方法 . 
9.3.1 BARRA 因子 模型 


假定 超额 收益 率 是 均值 修正 的 , 从 而 因子 实现 也 是 均值 修正 的 , (9.2) 式 的 因子 
模型 退化 为 
Tt = Bf, €i, (9.6) 
其 中 天 表示 (样本 ) 均值 修正 后 的 超额 收益 率 序 列 , 为 了 符号 上 的 简化 , 这 里 继续 
用 fi 作为 因子 实现 . 由 于 8 是 给 定 的 , (9.6) RRA k 个 观测 和 m 个 未 知 量 的 多 
元 线性 回归 . 由 于 公共 因子 的 数目 m 应 该 小 于 资产 的 数目 有, 从 而 回归 是 可 以 估计 
AY. 然而 , 回归 不 是 齐 次 的 , 因为 e, 的 协 方差 矩阵 D = diag{o?,… ,oz} 依赖 于 第 
i 个 资产 , 这 里 o? = Var(es). 因此 , 时 刻 t 的 因子 可 以 通过 加 权 最 小 二 乘 (WLS) 
方法 估计 , 且 权 重 为 个 性 因子 的 标准 误差 . 这 样 得 到 的 估计 为 
fi= (BD '!B') (BD p'r,). (9.7) 
在 实际 中 协 方差 矩阵 D 是 未 知 的 , 从 而 估计 时 需要 两 个 步骤 . 
第 一 步 , 在 每 个 时 刻 上 利用 普通 最 小 二 乘 (OLS) 方法 得 到 f, 的 一 个 初步 估计 
如 下 
Feo = (98) (8's.), 
其 中 第 二 个 下 标 o 表示 OLS hit. 该 因子 实现 的 估计 是 相合 的 但 不 是 有 效 的 . OLS 
回归 的 残 差 是 
Eto = Tt 一 Bf 
由 于 残 差 的 协 方差 矩阵 不 随时 间 变 化 , 从 而 我 们 可 以 将 所 有 的 残 差 放 在 一 起 ( 即 对 
F t=1,---,T) 来 得 到 D 的 估计 
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T 
D, — diag Is Y eon] : 
第 二 步 , 我 们 将 估计 D, 嵌入 以 得 到 因子 实现 的 修正 估计 
Fig = (8'Dy B) (8D, 85), (9.8) 
其 中 第 二 个 下 标 9 表示 广义 最 小 二 乘 (GLS) 估计 , 是 WLS 估计 的 一 个 样本 版 本 . 
修正 后 回归 的 残 差 为 
Etg 一 fi— Bf... 
由 此 我 们 可 以 估计 残 差 的 协 方差 矩阵 
T 
D, = diag ce Stents) $ 
t=} 
最 后 被 估 因 子 实现 的 协 方差 矩阵 为 
1 


a 
Xt = FT S es -Ff eu- f. 


t=) 


其 中 
Y c 
fa = T P fts 
t=1 
由 (9.6) 式 在 BARRA 方法 下 , 超额 收益 率 的 协 方差 矩阵 为 
Cov(r;) = Bd; E Dy 
1. 产业 因子 模型 


为 了 进一步 说 明 , 考虑 10 只 股票 的 超额 收益 率 , 并 用 产业 分 类 作为 具体 的 资 
产 基本 面 . 表 9-2 给 出 了 所 用 的 股票 . 它们 可 以 分 为 3 个 产业 类 别 , 即 , 金融 服务 、 
计算 机 和 高 科技 以 及 其 他 类 别 . 样本 区 间 仍 然 是 从 1990 年 1 月 到 2003 年 12 H. 
在 BARRA 的 框架 下 , 有 三 个 公共 因子 表示 这 三 个 产业 类 别 , A beta 是 这 三 个 产 
业 类 别 的 指示 变量 . 即 


Tit = Pir fit + Biefer + Biafacd- en, t=1,+-- ,10, (9.9) 
beta 为 


ST (9.10) 


其 中 ; = 1,2,3 分 别 表示 金融 , 高 科技 和 其 他 类 别 . 例如 , IBM 股票 收益 率 的 beta 
向 量 为 8; = (0, 1,0)', Alcoa 股票 收益 的 beta 向 量 为 B, = (0,0,1)/. 


l 1， 车 资产 i 属于 第 ) 个 产业 区 
ij 
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X 9-2 ”产业 因子 模型 分 析 中 用 到 的 股票 及 其 代码 " 


Company Flor) 
1.06(9.47) 


A.G.Edwards 1.36(10.2) 
Cc Citigroup 2.08(9.60) 


International Business 
Machines 


MWD Morgan Stanley 1.87(11.2) AA Alcoa 1.09(9.49) 
MER Merrill Lynch 2.08(10.4) CAT Caterpillar 1.23(8.71) 
DELL Dell Inc. 4.82(16.4) PG Procter&Gamble 1.08(6.75) 


HPQ Hewlett-Packard 1.37(11.8) 


a 超额 收益 率 的 样本 均值 和 样本 标准 差 也 在 表 中 给 出 . 样本 时 间 区 间 是 从 1990 年 1 月 到 2003 年 12 月 . 


(9.9) FF, fi, 是 金融 服务 类 的 因子 实现 , fo, 是 计算 机 和 高 科技 类 的 因子 实现 ， 
for 是 其 他 类 的 因子 实现 . 因为 by 是 指示 变量 , 所 以 f, 的 OLS 估计 非常 简单 . 事 
实 上 , f, 是 由 t 时 刻 每 个 类 别 的 超额 收益 率 的 平均 值 构 成 的 向 量 . 具体 地 ， 

AGE, + C, + MDW, + MER, 
4 
DELL; + HPQ, + IBM, 
3 
AA; + CAT, + PG; 
3 
第 ;个 资产 的 个 性 因子 仅仅 是 其 超额 收益 率 与 其 所 属 产业 类 样本 均值 的 差 . 于 是 
可 以 得 到 残 差 协 方差 矩阵 D 的 估计 , 并 由 此 得 到 广义 最 小 二 乘 估计 . 我 们 用 S-plus 
进行 分 析 . 首先 , 将 收益 率 加 载 到 S-plus 中 , 移 除 掉 样本 均值 , 创建 产业 类 哑 元 并 计 


fio= 


算 收益 率 的 样本 相关 和 矩阵 . 
> da=matrix (scan (file=’m-barra-9003.txt’),10) 
> rm = matrix (rowMeans (da) ,1) 
> rtn.rm = da - t({rm)%*%rep(1,168) 
> fin = c(rep(1,4),rep(0,6)) 
> tech = c(rep(0,4),rep(1,3),rep(0,3) 
> oth = c(rep(0,7),rep(1,3)) 
> ind.dum = cbind(fin,tech, oth) 
> ind.dum 
fin tech oth 
i1] 1 0 0 
[2,] 1 0 0 
{3,] a 0 0 
[4,] J: 0 0 
[5,] 0 1 0 
[6,] 0 1 0 
l2? 0 1 0 
[8,] 0 0 1 
[9,] 0 0 1 
[10,] 0 0 L 


> rtn=t (rtn.rm) 

> cov.rtn-var(rtn) 

> sd.rtn=sqrt (diag(cov.rtn) ) 

> corr.rtn=cov.rtn/outer(sd.rtn,sd.rtn) 
> print (corr.rtn,digits=1,width=2) 
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AGE C MWD MER DELL HPQ IBM AA CAT PG 
AGE 1.0 0.6 0.5 056 Q,3 0:3 OF OFS 0.3 0.2 
C 0;6 1.0 0-7 0." O22 Osh 0:4 0.4 Ore 0,3 
MAD. 0.6 20.7 1.0 0:8 ‘0.3 0:5 D4 0.4 0.3 0.3 
MER 0.6 20.7 0.8 1.0 0.2 30.5 0.3 90.4 0.3 0.3 
DELL 0.3 0.2 0:3 0.2 1.0 0.5 O84 0:3 0.1 OVD 
HPO :0.3 0.4 O08 9.5 Ms 1.0 (0.5 0:5 :0.2 Bal 
IBM 0.3 0.4 0.4 0.3 0.4 0.5 2.0 0.4 .0.3 -0,0 
AA 0.3. 0:4 0.4 0.4. 0.3 O65 0.4 1.0 0.6 0:1 
GAT (0.3 0,4 O52 0.3 0.1 0.2 0.3 0,6 1.0 20;1 
PG 0.2 20.3. 0.3 0.3. Gt QLI 50,0 Q.X 0.2 1.0 


下 面 给 出 了 OLS 估计 、 残 差 和 残 差 的 方差 估计 . 


> F.hat.o = solve(crossprod(ind.dum))$*$t(ind.dum)$*$rtn.rm 
> E.hat.o = rtn.rm - ind.dum£*£F.hat.o 
> diagD. hat .o=rowVars (E.hat.o) 


接 下 来 便 可 以 得 到 广义 最 小 二 乘 估计 ， 


> Dinv.hat = diag(diagD.hat.o^(-1)) 

> H1 = t(ind.dum)$*$Dinv.hat$*$ind.dum 

> Hmtx=solve (H1) $*%t (ind.dum) $*%Dinv. hat 

> F.hat.g = Hmtxt*trtn.rm 

> F.hat.gt=t (P.hat.g) 

> E.hat.g = rtn.rm - ind.dumt*%F.hat.g 

> diagD.hat.g = rowVars(E.hat.g) 

> t (Hmtx) 

fin tech oth 

[1,] 0.1870 0.0000 0.0000 
ey W 0.2548 0.0000 0.0000 
[3,1 0.2586 0.0000 0.0000 
[4,] 0.2995 0.0000 0.0000 
[5,] 0.0000 0.2272 0.0000 
[6,1 0.0000 0.4015 0.0000 
DA 0.0000 0.3713 0.0000 
[8,] 0.0000 0,0000 0.3319 
[9,] 0.0000 0.0000 0.4321 
[10,] 0.0000 0.0000 0.2360 


> cov.ind-ind.dum$*$var(F.hat.gt)t*$*t(ind.dum) + 
+ diag(diagD.hat.g) 

> sd.ind=sqrt (diag(cov.ind) ) 

> corr.ind=cov.ind/outer (sd.ind,sd.ind) 

> print (corr.ind,diqits-1,width-2) 


AGE C MWD MER DELL HPQ IBM AA CAT PG 
AGE 1.0 0.7 GT 0.7 0.3 '0.3 0.3 0.3 0.3. 0,3 
c 0.7 1.0 0.8 0.8 0.3 0.4 0.4 0.3 0.3 0.3 
MWD 0.7 0.8 2.9 0.8 0.3 20.4 0.4 0.3 0.4 0.3 
MER 0.7 0.8 0.8 1.0 0.3 0.4 0.4 0.3 0.4 0.3 
DELL 0.3 0.3 0.3 0.3 1.0 0.5 0.5 0.2 0.2 0.2 
HPO 0.3 0.4 0.4 0.4 0:5 1.0 0.7 0.3 0.3 0.2 
TEM 0.3 0.4 0.4 0,4 D.5 0.7 21.0 0.3 0.3 Q.2 
AA O53) 0.3. WE O53 O58 0.2 83 1:9 Q7 948 
CAT 0.3 0.3 (0.4 0,4. 0.2. 0.3 OCS 0.7 1.0 0.6 
PG 0:3, O53) 1023: 0.3. 0,2. 0:2 0.2 0.5 O56 IsO 
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由 模型 得 到 的 产业 类 内 的 股票 的 相关 和 矩阵 要 比 样本 相关 矩阵 大 . 例如 ， 股 票 
CAT 和 PG 的 样本 相关 系数 只 有 0.1, 但 是 基于 所 拟 合 模型 得 到 的 相关 系数 是 0.6. 
图 9-3 给 出 了 基于 广义 最 小 二 乘 估计 给 出 的 因子 实现 的 时 间 图 . 


1990 1992 1994 ey _ 1998 2000 2002 2004 
(b) atts 


20 

个 

"| A Ws Ple | 
—20 


1900 1992 1994 1996 1998 2000 2002 2004 
年 


(c) 其 他 类 
20 
m 0 
一 20 
1990 1992 1994 1996 1998 2000 2002 2004 
年 


图 9-3 对 三 个 产业 类 的 10 只 股票 拟 合 BARRA 产业 因子 模型 所 估计 的 因子 实现 


2. 因子 模拟 组 合 

考虑 带 单 因 子 的 BARRA 因子 模型 这 种 特殊 情况 .这 里 (9.7) 式 给 出 的 有 的 
WLS 估计 提供 了 很 好 的 解释 . 考虑 个 资产 的 组 合 w = (uis w). 该 组 合 是 
下 述 最 小 化 问题 的 解 : 

min (24 De) 1 满足 w'P=1. 
该 组 合 问题 的 解 由 下 式 给 出 : 
w' — (8'D^! 8) (8D). 
因此 , 被 估 因 子 实现 是 如 下 组 合 的 收益 率 : 
fh wr. 

如 果 将 组 合 w 标准 化 , 即 满 足 xw = 1, 则 称 之 为 因子 模拟 组 合 . 对 多 个 因子 的 情 
况 , 可 以 对 每 个 因子 单独 应 用 该 思想 . 


注释 : 在 实际 中 , 超额 收益 率 的 样本 均值 经 常 与 0 没有 显著 的 区 别 . 因此 , 在 
拟 合 一 个 BARRA 因子 模型 之 前 , 通常 不 需要 移 除 样本 均值 1 
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9.3.2 Fama-French 方法 


对 一 个 给 定 的 资产 基本 面 (例如 账面 价值 与 市 场 价值 的 比率 ), Fama 和 French 
(1992) 使 用 两 个 步骤 来 决定 因子 实现 , 首先 , 他 们 基于 观测 到 的 基本 面 的 值 将 资产 
分 类 . 然后 他 们 构造 了 一 个 对 冲 组 合 . 该 组 合 持 有 分 类 资产 前 面 1/3 的 多 头 , HFF 
有 分 类 资产 后 面 2/3 的 空头 . 对 于 给 定 的 资产 基本 面 , t 时 刻 所 观测 到 的 该 对 冲 组 
合 的 收益 率 就 是 所 观测 到 的 因子 实现 . 对 于 所 考虑 的 资产 基本 面 重 复 上 面 的 步骤 . 
最 后 , 给 定 观测 到 的 因子 实现 {flt = 1,--- ,T}, 并 用 时 间 序 列 的 回归 方法 来 估计 
每 个 资产 的 beta. 为 了 解释 超额 收益 率 变动 性 的 高 百分比 , Fama 和 French 确认 了 
三 个 观测 到 的 基本 面 . 他 们 所 用 的 三 个 基本 面 是 (a) 全 部 的 市 场 收 益 率 (市 场 超额 
收益 率 ); (b) 与 大 股票 相关 的 小 股票 的 业绩 (SMB, 小 的 减 掉 大 的 ); (c) 与 成 长 型 股 
票 相 联系 的 价值 型 股票 的 业绩 (HML, 高 对 低 ). 通过 市 场 资产 净值 和 市 场 资 产 净值 
对 账面 资产 净值 的 比率 来 定义 价值 型 股票 和 成 长 型 股票 . 账面 资产 净值 对 市 场 资 
产 净 值 的 比率 高 的 股票 称 为 价值 型 股票 . 

注释 : 不 同 因子 模型 中 因子 的 概念 可 能 不 同 . 在 Fama-French 方法 中 所 用 的 三 
个 因子 是 三 个 金融 基本 面 . 也 可 以 将 这 些 基本 面 组 合 起 来 构成 股票 的 一 个 新 的 属 
性 , 并 将 所 得 到 的 模型 看 作 单 因子 模型 . 这 里 之 所 以 这 样 是 因为 所 用 的 模型 是 线性 
统计 模型 ， 因 此 , 在 因子 模型 中 当 提 到 因子 的 个 数 时 应 该 特别 注意 . 另 一 方面 , 对 
于 因子 的 个 数 , 统计 因子 模型 中 有 相当 好 的 定义 . 下 面 我 们 将 对 此 进行 讨论 . 口 


9.4 Ema 


在 多 元 时 间 序 列 分 析 中 , 一 个 重要 的 问题 是 对 序列 的 协 方差 (或 相关 系数 ) 结 
构 的 研究 . 例如 , 问 量 收益 率 序 列 的 协 方差 结构 在 组 合 选 择 中 起 着 很 重要 的 作用 . 
下 面 , 我 们 讨论 一 些 统计 方法 . 它们 在 研究 时 间 序 列 的 协 方差 结构 时 非常 有 用 . 

给 定 一 个 大 维 随机 向 量 r= (ri,:… re)! , 其 协 方差 矩阵 为 X. 则 主 成 分 分 析 
(principal component analysis, 简 记 为 PCA) 关心 的 是 利用 r: 很 少 的 线性 组 合 来 解 
FD, 的 结构 . 如 果 r 表示 大 个 资产 的 月 对 数 收益 率 , 则 可 用 PCA 来 研究 这 大 个 
资产 收益 率 变化 的 原因 . 这 里 关键 词 是 很 少 , 从 而 使 得 多 元 分 析 可 以 获得 简化 . 
9.4.1 PCA 理论 

PCA X} r 的 协 方差 矩阵 X, WIKE p, 都 适用 . 因为 相关 知 阵 是 标准 化 
随机 变量 7* = Sr 的 协 方差 矩阵 , 此 处 S 是 7 的 分 量 的 标准 差 组 成 的 对 角 和 矩阵 ， 


所 以 在 我 们 的 理论 分 析 中 使 用 协 方差 矩阵 . 令 wi = (wa, swa) 表示 上 HE, 
XH i—1,-.,k. 那么 


k 
/ 
yi — eT > WijTj 
j=1 
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是 随机 向 量 > 的 线性 组 合 . 车 r 由 只 股票 的 简单 收益 率 组 成 , 则 v; 是 对 第 j 只 
股票 赋予 权重 ws 之 后 所 形成 的 组 合 的 收益 率 . 因为 将 v, 乘 上 一 个 常数 并 不 影响 


分 配 到 第 j 支 股票 上 的 权重 , 所 以 我 们 将 向 量 wi 标准 化 , 使 得 wiwi = 2 02 = 1. 
利用 随机 变量 线性 组 合 的 性 质 , 我 们 有 


Var(yi) = w: Dwi, i = G Mn a k, (9.11) 


Cov(yi, 93) — wi Dy, i, j —-1,.-- ,K. (9.12) 


PCA 的 思想 就 是 找到 线性 组 合 wi HAM IAT 有 yi 5 y; 是 不 相关 的 , 并 且 y; 的 
方差 尽 可 能 大 . 更 具体 地 : 

(1) r 的 第 一 个 主 成 分 是 在 wiwi = 1 的 限制 下 , 使 得 Vart) 最 大 的 线性 组 合 
yi = wir; 

(2) r 的 第 二 个 主 成 分 是 在 ww = 1 与 Cov(yz yi) = 0 的 限制 下 , 使 得 Var(zo) 
最 大 的 线性 组 合 yo = wir; 

(3) r 的 第 i 个 主 成 分 是 在 wiw; = 1 5 Cov(wi,yj) = 0, 7 =1,--- i—1 的 限 
制 下 , 最 大 化 Var(y;) 的 线性 组 合 y; = wir. 

KA D. 的 协 方差 矩阵 是 非 负 定 的 , 所 以 它 具 有 谱 分 解 ( 见 第 8 章 附录 A), 令 
(à, €1) (Ak, ex) 2g X. 的 特征 值 (特征 向 量 组 ), 其 中 A, > AQ > --- > A, 0, BU 
我 们 有 下 面 的 统计 结果 . 
结果 9.1 的 第 i i ERIE y= er = X eyri =h k. 而 且 


Var(yi) = ef De; =A; t= bey. 


Cov(w.y;j)-— efX,e;=0, 17 


如 果 茶 些 特征 值 Xi 是 相等 的 , 则 对 应 特征 向 量 e; 的 选择 不 是 唯一 的 , 从 而 yi 
也 不 是 唯一 的 . 另外, 我 们 有 


Var(r;) = tr(3.,.) = > Ai = x Var(y;). (9.13) 
t=] 
等 式 (9.13) 说 明 
Var(yi) = ^ 
aay Tete 


因此 , r 的 总 方差 中 由 第 i 个 主 成 分 解释 的 比例 是 X. 的 第 i 个 特征 值 占 XV 的 所 
有 特征 值 总 和 的 比率 . 也 可 以 计算 由 前 i 个 主 成 分 所 能 解释 的 总 方差 的 毗 积 比例 
( 即 Y A (È Aj), 实际 中 , 可 以 选择 一 个 较 小 的 i 使 得 前 面 的 累积 比例 很 大 . 
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因为 tr(p,) = k, 所 以 当 采用 相关 阵 来 进行 主 成 分 分 析 时 , 由 第 i 个 主 成 分 解 
释 的 方差 比例 变 为 和/ 

PCA 的 一 个 副产品 是 X, 或 p, 的 0 特征 值 表 明 r 的 分 量 之 间 存 在 精确 的 
线性 关系 . 例如 , 如 果 最 小 特征 值 Xe 一 0, 则 由 结果 9.1 知 Var(yx) = 0. BAU, 
W = X ery 是 个 常数 , 从 而 在 r 中 只 有 — 1 个 随机 量 ， 在 这 各 情形 下 , 的 维 
数 可 以 降低 . 由 于 这 个 原因 ,文献 中 常用 PCA 作为 降低 维 数 的 工具 . 

9.4.2 经验 的 PCA 


应 用 中 , 收益 率 向 量 ” 的 协 方差 矩阵 X, AREE p, 是 未 知 的 , 但 在 一 些 
正则 性 条 件 下 ， ec 假定 收 
益 率 是 弱 平 稳 的 , 且 数 据 为 (n|t— 1,… T), 则 我 们 有 如 下 估计 : 


T7 
È, = [ijr] = mde =f) (re =F), r= re (9.14) 
t=1 


bt $9 (9.15) 


其 中 S = diag{fV5rr，…,V5kkr}l 是 由 re 的 样本 标准 差 构成 的 对 角 和 矩阵 .从 而 
可 以 利用 计算 对 称 和 矩阵 的 特征 值 和 特征 向 量 的 方法 来 进行 主 成 分 分 析 . 现在 大 多 数 
统计 包 都 能 进行 主 成 分 分 析 . 在 S-Plus 中 , 进行 主 成 分 分 析 的 基本 命令 是 princomp， 
在 FinMetrics 中 则 为 mfactor. 
例 9.1 考虑 IBM, Hewlett-Packard, Intel Corporation, Merrill Lynch 与 Morgan 
Stanley Dean Witter 从 1990 年 1 月 至 1999 年 12 月 的 月 对 数 收 益 率 . 此 收益 率 以 
百分比 表示 , HARA. 数据 集 共有 120 个 观测 值 . 图 9-4 给 出 了 这 5 种 月 收益 
率 序列 的 时 间 图 . 如 所 料想 , 同一 工业 部 门 的 公司 收益 率 倾 向 于 展现 出 相似 的 模式 . 
用 r’=(IBM, HPQ, INTC, MER, MWD) 表示 这 些 收益 率 , 其 样本 均值 向 量 为 
(1.47, 1.97, 3.05, 2.30, 2.36)’, 样本 协 方 差 矩阵 和 样本 相关 和 殉 阵 为 


73.10 
36.48 103.60 

Y= | 27.08 48.86 113.96 | 
16.06 37.59 27.96 105.56 
16.33 40.72 26.86 85.47 109.91 


1.00 
0.42 1.00 

p,= | 0.30 0.45 1.00 
0.18 0.36 0.26 1.00 
0.18 0.38 0.24 0.79 1.00 
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1990 1992 1994 1996 1998 2000 
年 
(d) MER 
» 20 
| 
Ex 40 
1990 1992 1994 1996 1998 2000 
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1990 1992 1994 1996 1998 2000 


年 
图 9-4 以 下 5 个 公司 月 对 数 收益 率 的 时 间 图 ， 其 中 对 数 收益 率 以 百分比 表示 且 包 含 分 红 , 时 
间 区 间 是 从 1990 年 1 月 至 1999 年 12 H: (a)IBM; (b) Hewlett-Packard: (c) Intel; 
(d) Merrill Lynch; (e) Morgan Stanley Dean Witter 


表 9-3 HEH TAE Ar EAE REAA EA EET AE RY PT AR RS T 
征 值 、 特征 向 量 以 及 由 主 成 分 解释 的 变化 比 . ABAK, 并 用 A, 和 &; 来 表示 
样本 特征 值 与 特征 向 量 . 对 前 两 个 主 成 分 , 我 们 有 


Ai 一 2.456， ê = (0.342, 0.474, 0.387, 0.503, 0.505)’, 


Ng = 1.145, êz = (0.525, 0.314, 0.405, —0.481. —0.481)’. 


这 两 个 成 分 大 约 解释 了 数据 全 部 变化 的 72%, 且 它 们 具有 有 趣 的 解释 ， 第 一 个 成 
分 是 股票 收益 率 的 一 个 大 致 为 等 权重 的 线性 组 合 . 这 个 成 分 可 能 代表 股票 市 场 的 一 
般 运 动 , 从 而 是 一 个 市 场 成 分 ， 第 二 个 成 分 代表 两 个 工业 部 门 ( 即 技术 和 金融 服 
务 ) 的 差 . 它 可 能 是 个 工业 成 分 . 利用 7 的 协 方差 矩阵 也 可 以 发 现 主 成 分 的 类 似 
解释 . 

应 用 中 确定 主 成 分 个 数 的 一 个 非 正 式 但 是 很 有 用 的 方法 是 检查 斜坡 图 (scree 
plot). 它 是 特征 值 Xi 按 由 大 到 小 次 序 排列 之 后 的 时 间 图 (BNA, 对 i 的 图 ). 图 9-5a 
给 出 了 例 9.1 中 的 5 种 股票 收益 沸 的 斜坡 图 . 通过 在 斜坡 图 中 寻找 转弯 处 , 这 表明 
余下 的 特征 值 相 对 较 小 并 大 致 看 上 去 是 相同 的 ， 所 以 我 们 可 以 选择 一 个 恰当 的 主 
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成 分 的 个 数 . 对 图 9-5 的 两 个 图 来 说 , 两 个 主 成 分 看 起 来 是 合适 的 . 最 后 , 除了 对 

j»i f X; 20 的 情形 , 选择 前 i 个 主 成 分 仅仅 提供 了 数据 总 方差 的 一 个 近似 . 如 

果 一 个 很 小 的 i 可 以 提供 一 个 好 的 近似 , 则 这 种 简化 是 有 价值 的 . 

表 9-3 对 IBM, Hewlctt-Packard, Intel, Merrill Lynch 与 Morgan Stanley Dean 
Witter 从 1990 年 1 月 至 1999 年 12 月 的 月 对 数 收益 率 进 行 主 成 分 分 析 的 结果 


利用 样本 协 方差 窍 阵 
特征 值 256.16 116.14 64.91 46.82 22.11 
比例 0.506 0.229 0.128 0.093 0.044 
累积 0.506 0.736 0.864 0.956 1.000 
特征 向 量 0.246 0.327 0.586 —0.700 0.018 
0.461 0.360 0.428 0.687 一 0.050 
0.409 0.585 —0.683 一 0.153 0.033 
0.522 —0.452 —0 082 —0.115 —0.710 
0.536 —0.467 —0.036 —0.042 0.701 
m 利用 样本 相关 阵 
特征 值 2.456 1.145 0.699 0.495 0.205 
比例 U.491 0.229 0.140 0.099 0.041 
累积 0.491 0.720 0.860 0.959 1.000 
特征 向 量 0.342 0.525 0.691 一 0.362 一 0.012 
0.474 0.314 一 0.043 0.820 0.050 
0.387 0.405 —0.717 —0.414 —0.034 
0.503 —0.481 0.052 —0.147 0.701 
0.505 一 0.481 0.071 —0.062 一 0.711 
a 特征 向 最 是 以 列 向 量 形式 给 出 的 . 
(a) 5 个 股票 收益 率 (b) 5 个 债券 指数 收益 率 
2.5 
4 
2.0 
3 
2 2 
* 15 E 
1.0 
1 
0.5 
0 
1 2 3 4 5 1 2 3 4 5 


图 9-5 两 个 5 维 资产 收益 率 的 斜坡 图 : (a) 例 9.1 中 的 序列 ; (b) 例 9.3 中 的 债券 指数 收益 率 


注释 : ”将 例 9.1 中 的 数据 扩展 到 2003 年 12 月 ,对 扩展 后 的 数据 进行 主 成 
分 分 析 所 得 到 的 结果 与 例 9.1 中 给 出 的 结果 基本 一 样 , 因此 略 去 了 . 下 面 给 出 了 在 
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S-Plus 中 进行 主 成 分 分 析 的 命令 . S-Plus 给 出 了 特征 值 的 平方 根 , 并 将 其 作为 标准 
i. 


> da-matrix(scan(file-'m-pca5c-9003.txt'),6) 

> rtn = t(da[1:5,]) 

> pca.cov = princomp(rtn) 

» namesípca.cov) 

> summary (pca.cov) 

> pca.cov$loadings 

> Bcreeplot (pca.cov) E] 


9.5 ”统计 因子 分 析 


我 们 现在 转向 统计 因子 分 析 . 多 元 统计 分 析 中 的 一 个 主要 困难 是 “ 维 数 的 祸 
di". 特别 地 , 当 模 型 的 阶 或 时 间 序 列 的 维 数 增加 时 , 参数 模型 的 参数 数量 也 经 常 陡 
增 . 通常 要 寻找 简化 方法 来 克服 维 数 所 带 来 的 祸害 . 从 实证 的 观点 出 发 , 多 元 数据 
经 常 表现 出 一 些 相似 的 模式 , 这 表明 数据 中 存在 潜藏 的 共同 结构 . 统计 因子 分 析 是 
文献 中 可 以 利用 的 简化 方法 之 一 . 它 的 目的 是 识别 几 个 因子 , 使 得 它们 能 够 解释 数 
据 的 协 方 矩阵 差 与 相关 矩阵 中 的 绝 大 部 分 变化 . 

传统 的 统计 因子 分 析 假定 数据 没有 序列 相关 性 ， 由 于 金融 数据 经 常 是 以 小 于 
或 等 于 一 周 的 频率 抽取 的 , 所 以 经 常 违反 这 个 假定 . 然而 , 这 个 假定 对 低频 数据 的 
资产 收益 率 (如 股票 或 市 场 指数 的 月 收益 率 ) 看 上 去 是 合理 的 .如 果 违 背 了 这 个 假 
定 , 则 可 以 利用 本 书 中 讨论 的 参数 模型 消除 数据 的 线性 动态 依赖 , 并 对 残 差 序列 应 
用 因子 分 析 . 

下 面 , 我 们 讨论 基于 正 交 因子 模型 (orthogonal factor model) 的 因子 分 析 . 考 
虑 第 t 期 个 资产 的 收益 率 Te = (rusos sree), 并 假定 re 是 弱 平稳 的 , 其 均值 
为 n, 协 方差 矩阵 为 Xu. 因子 模型 假定 rt 线性 地 依赖 于 少数 不 可 观测 的 随机 变量 
f, = (fit, fai. »doi) 与 k 维 附 加 噪声 Et 一 (£15,777 Ept) 这 里 m. < k, fit 是 公 
共 因 子 , eit 是 误差 . 数学 上 , 统计 因子 模型 具有 (9.1) 式 的 形式 , 只 是 用 均值 收益 n 
代替 截 距 o. 因此 因子 模型 有 如 下 形式 


T, — p= BF, + Et, (9.16) 


其 中 B = [Bijlkxm FEAF AFTER, Bij 是 第 i 个 变量 在 j 个 因子 上 的 负荷 , s 是 
rit 的 个 性 误差 . 统计 因子 模型 的 一 个 关键 特征 是 m 个 因子 fa 和 因子 负荷 Bi; 都 
是 不 可 观测 的 . 正 因为 如 此 , (9.16) 式 不 是 一 个 多 元 线性 回归 模型 . 尽管 它 看 上 去 
与 多 元 线性 回归 模型 相似 . 

称 (9.16) 式 的 因子 模型 是 一 个 正 交 因子 模型 , 如 果 它 满足 下 面 的 假定 : 

(1) E(f,) =0, Cov(f,) = Im Am x m WYSE: 

(2) E(e;) = 0, Cov(e;) = D = diag{o?,--- o2 (Bl D J& k x k A FASERE): 
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(3) f, 5 e 是 独立 的 , 从 而 Cov( ft. c1) = E(fie!) = 054. 
在 上 述 假定 下 , 很 容易 看 出 


X, = Cov(r;) = Ef(r:—u)(r:—u4)'] 
= E[(Bf, + &)(Bf, 4- €,)'] = Bp’ +D (9.17) 


H 
Cov(r:, f,) = Ellr: — 1u)f;] = 8E(f.f;) + E(ef) = B. (9.18) 
利用 (9.17) 式 和 (9.18) sh, 我 们 看 出 , 对 (9.16) 式 中 的 正 交 因子 模型 


Var(rit) = Bg +--+: + Bin +07, 


Cov (rit: rji) 一 Ba By Tene Bim sm 
Cov (Tins fj) n Biz- 


由 m 个 公共 因子 贡献 的 ri 的 方差 部 分 82, 2-82, 称 为 共性 方差 (Communality). 
rit 方差 的 剩余 部 分 o7 称 为 唯一 性 方差 或 个 性 方差 . 令 c? = 82, o 82, 为 共 
性 方差 , 它 是 第 i 个 变量 对 m 个 公共 因子 的 负荷 的 平方 和 . 分 量 mit 的 方差 变 为 
Var(rit) = c2 4- o2. 

实际 中 , 并 非 每 个 协 方差 矩阵 都 具有 正 交 因子 表示 . 换 句 话说 , 一 个 不 具有 任 
何 正 交 因子 表示 的 随机 变量 r 是 存在 的 . 而 且 , 随机 变量 的 正 交 因子 表示 并 不 唯 
一 , 事实 上 , 对 任何 满足 PP’ = P'P = I 的 mxm EXER P, ^ 8* = BP, 
f: = Ff, 则 


ru p — Bf, +e. — BPP'f, e =P fi +e. 


另外 E(f?) = 0, Cov(f7) = P'Cov(f,)P = P'P = I. 这 样 , 8^ 和 f; Mr, 建立 了 
另 一 个 正 交 因 子 模型 . 正 交 因子 表示 的 这 种 不 唯一 性 既是 缺点 , 又 是 因子 分 析 中 的 
一 个 优点 . 说 它 是 缺点 是 央 为 它 使 得 因子 负荷 的 意义 不 确定 了 . 它 也 是 一 个 优点 ， 
因为 它 允 许 我 们 进行 旋转 来 寻找 具有 良好 解释 的 公共 因子 . 因为 P dÉ— P IEASAB 
ME, 所 以 变换 f? = P'f, 是 m 维 空间 中 的 一 个 旋转 . 


9.5.1 估计 


(9.16) 式 中 的 正 交 因子 模型 可 以 通过 两 种 方法 估计 . 第 一 种 方法 利用 前 一 节 中 
的 主 成 分 分 析 . 这 个 方法 不 要 求 数据 的 正 态 性 假定 , 也 不 要 求 预先 指定 公共 因子 的 
个 数 . 它 对 协 方差 矩阵 和 相关 矩阵 都 是 适用 的 . 但 是 同 PCA 中 所 提 到 的 一 样 , 这 
个 解 通常 只 是 一 个 近似 . 第 二 种 估计 方法 是 最 大 似 然 方法 . 它 利 用 正 态 密度 , 并 要 
求 预先 指定 公共 因子 的 个 数 . 
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主 成 分 方法 
再 次 令 (和 ,6&1),… (An. x) 是 样本 协 方差 矩阵 Xt. 的 特征 值 和 特征 向 量 对 , 其 
HHA, > de > ik. Sm <k WASH, 则 因子 负荷 矩阵 由 下 式 给 出 


B= [Bi] = [Via vS "xa Vimen|. (9.19) 


个 性 方差 的 估计 是 矩阵 3, — BB' 的 主 对 角 线 上 的 元 素 . BID = diag{63,… ,62), 
FEP ô? = Gir Y AB, , Guy J& Xy 058 (i,i) 个 元 素 . 共性 方差 的 估计 为 
& = Bh +--+ fy. 
由 近似 产生 的 误差 矩阵 为 oe 
X, i (88 T D). 

我 们 当然 希望 这 个 矩阵 接近 于 0. 可 以 证 明 X, — (BB + D) 的 元 素 的 平方 和 小 于 
或 等 于 X te + AR. 因此 , 近似 误差 的 上 界 为 所 忽略 的 特征 值 的 平方 和 . 

由 (9.19) 式 的 解 , 基于 主 成 分 方法 的 因子 负荷 估计 并 不 随 着 公共 因子 m 的 增 
加 而 改变 . 


最 大 似 然 方法 


如 有 果 公共 因子 f, 和 个 性 因子 s, 是 联合 正 态 的 , 那么 r 是 多 元 正 态 的 , Bd 
均值 为 u DAZE X, = BB' + D. 在 8'D^ 8 = A( 它 是 一 个 对 角 和 矩阵 ) 的 
限制 下 , 可 以 利用 最 大 似 然 方法 得 到 8 和 D 的 估计 . 这 里 u 是 由 样本 均值 估计 的 . 
对 这 个 方法 的 细节 , 读者 可 以 参考 Johnson 和 Wichern (2002). 

在 利用 最 大 似 然 方法 时 , 公共 因子 的 个 数 必须 事先 给 定 . 在 实际 中 , 可 以 用 修 
正 的 似 然 比 检验 来 检查 所 拟 合 的 m- 因子 模型 的 充分 性 . 检验 统计 量 是 


LR(m) = — |r p= = (2k 45) — im (In || — In |B’ + DJ). (9.20) 
在 mm 个 因子 的 零 假设 下 , ERRA EAA AE É EA (Ue my -k- mi 
的 卡 方 分 布 . 我 们 将 在 9.6.1 小 节 讨 论 选 择 m 的 一 些 方法 . 
9.5.2 ”因子 旋转 

正如 前 面 提 到 的 , 对 任何 m x m 正 交 矩阵 P, 
ri— B= Pf,+e=B fi +e, 
其 中 B* = BP, f; = P'f,. 另外 ， 
BB' | D= BPP'Bg' + D = B*(8*y + D. 


这 个 结果 说 明 : 共性 方差 与 个 性 方差 在 正 交 变换 下 保持 不 变 . 因此 寻找 一 个 正 交 
KARE P 来 变换 因子 模型 使 得 公共 因子 具有 良好 的 性 质 就 是 合理 的 .这 样 一 个 变 
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换 等 价 于 将 公共 因子 在 m 维 空间 中 旋转 . 事实 上 , 有 无 限 个 可 以 利用 的 因子 旋转 . 
Kaiser(1958) 提出 了 一 个 方差 最 大 化 准则 (Varimax criterion) 来 选择 旋转 . 这 在 许 
多 应 用 中 都 运作 地 很 好 . id 8* = [97] 是 旋转 后 的 因子 负荷 矩阵 , c2 表示 第 i 个 共 
性 方差 . 定义 Bt, = Byla 为 经 过 共性 方差 (E) 平方 根 的 尺度 变换 之 后 的 旋转 系 
数 . 方差 最 大 化 方法 是 选择 对 角 和 矩阵 P, 使 得 下 式 最 大 化 


m k k 2 

y ss DD x (85)* — i (xar) | 
j=1 | = i= 

这 个 复杂 的 表示 有 一 个 简单 的 解释 . 最 大 化 V, 对 应 于 尽 可 能 多 地 分 散 每 个 因子 负 

荷 的 平方 . 因此 , 此 方法 是 为 了 在 因子 负荷 的 旋转 矩阵 的 任何 列 中 寻找 大 的 但 可 以 

忽略 联合 功效 的 组 . 在 实际 应 用 中 , 使 用 因子 旋转 来 帮助 解释 公共 因子 . 这 在 一 些 

应 用 中 可 能 有 益 , 但 在 其 他 应 用 中 未 必 有 有 上 用. 对 于 因子 旋转 有 许多 可 用 的 准则 . 


9.5.3 ”应 用 


给 定 资产 收益 率 的 数据 (n). 因子 分 析 使 得 我 们 能 够 找到 一 些 公共 因子 来 解 
释 收 益 率 变化 . 由 于 因子 分 析 修 定数 据 没 有 序列 相关 性 , 所以 在 使 用 因子 分 析 前 应 
该 检验 这 个 假定 的 正确 性 . 为 此 , 我 们 可 以 使 用 多 元 混成 统计 量 . 如 果 发 现 有 序列 
相关 性 , 则 可 以 构造 一 个 VARMA 模型 来 消除 数据 中 的 动态 相依 性 , 并 且 对 残 差 序 
列 运用 因子 分 析 . 对 许多 收益 率 序列 , 线性 模型 残 差 的 相关 矩阵 经 常 非常 接近 于 原 
始 数据 的 相关 和 拢 阵 . 在 这 种 情形 下 , 动态 依赖 对 因子 分 析 的 影响 是 可 以 忽略 的 ， 
本 小 节 考 虑 3 个 例子 . 前 2 个 例子 用 Minitab 软件 进行 分 析 , 第 3 个 例子 用 
S-Plus 分 析 . 也 可 以 用 其 他 程序 包 . 
例 9.2 再 次 考虑 例 9.1 中 使 用 的 IBM, HewLett-Parkard, Intel, Merrill Lynch 和 
Morgan Stanley Dean Witter 的 月 对 数 股票 收益 率 . 为 了 检验 序列 不 相关 的 假设 , 我 
们 计算 泥 成 统计 量 得 到 Qi(1) = 34.28, Qs(4) = 114.30, Qs(8) = 216.78. 与 自由 度 
为 25, 100 和 200 的 x? 分 布 比 较 , 这 些 检验 统计 量 的 p 值 分 别 是 0.102,0.156 和 
0.198. 因此 , 即使 在 10%% 的 水 平 下 都 不 能 拒绝 序列 无 关 的 假设 . 
X 9-4 给 出 了 基于 相关 和 矩 阵 运 用 主 成 分 方法 和 最 大 似 然 方法 的 因子 分 析 结 果 . 
我 们 假定 共同 因子 的 个 数 是 2. 根据 例 9.1 中 的 主 成 分 分 析 , 这 种 取 法 是 合理 的 . 从 
表 中 可 见 , 因子 分 析 揭 示 了 几 个 有 趣 的 发 现 . 
。 由 主 成 分 方法 识别 的 两 个 因子 比 最 大 似 然 方 法 识别 的 因子 解释 了 更 多 的 变 
25. 
e 根据 旋转 后 的 因子 负荷 , 两 种 方法 对 数据 基本 上 识别 了 同样 的 两 个 公共 因子 . 
金融 股 (Merrill Lynch 和 Morgan Stanley Dean Witter) 对 第 一 个 因子 的 负 
荷 很 大 , 而 技术 股 (IBM, Hewlett-Packard 和 Intel) 对 第 二 个 因子 的 负荷 很 
大 . 这 两 个 旋转 后 的 因子 联合 区 分 了 工业 部 门 . 
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。 在 这 个 特例 中 , 方差 最 大 化 的 旋转 并 没有 将 最 大 似 然 方法 识别 的 两 个 因子 改 
变 很 多 . 然而 由 主 成 分 方法 识别 的 第 一 个 非 旋 转 因 子 被 旋转 去 掉 了 . 根据 方 
差 最 大 化 准则 背后 的 思想 , 这 并 不 奇怪 . 

* IBM 和 Intel 股票 基于 最 大 似 然 方法 的 收益 率 的 个 性 方差 相当 大 , 从 而 暗示 
了 这 两 只 股票 有 一 些 特征 值得 我 们 进一步 研究 . 


表 9-4 IBM, HewLett-Packard, Intel, Merrill Lynch 和 Morgan Stanley Dean 
Witter 的 月 对 数 股 票 收 蔓 率 的 因子 分 析 * 


fi E ff i 1-6? 
主 成 分 法 
IBM 0.536 0.561 0.011 0.776 0.602 
HPQ 0.744 0.335 0.317 0.752 0.665 
INTC 0.607 0.433 0.151 0.730 0.556 
MER 0.788 一 0.515 0.928 0.158 0.887 
MWD 0.791 一 0.514 0.930 0.161 0.891 
变量 2.456 1.145 1.850 1.751 3.601 
LE 0.491 0.229 0.370 0.350 0.720 
最 大 似 然 法 
IBM 0.191 0.496 0.087 0.524 0.282 
HP 0.394 0.689 0.247 0.755 0.630 
INTC 0.250 0.511 0.141 0.551 0.323 
MER 0.800 0.072 0.769 0.232 0.645 
MWD 0.994 —0.015 0.976 0.186 0.988 
变量 1.881 0.987 1.632 1.236 2.868 
比例 0.376 0.197 0.326 0.247 0.574 
a Kat 8.8 SEL, 时 间 是 从 1990 年 1 月 到 1999 年 12 H. 分 析 基于 样本 交叉 -相关 阵 并 假定 有 两 
个 公共 因 于 . 


例 9.3 ”在 这 个 例子 中 , 我 们 考虑 期 限 为 30 年 、20 年 、10 年 、5 年 和 1 年 的 美国 
债券 指数 的 月 对 数 收 益 率 . 例 9.2 中 描述 过 这 个 数据 , 但 被 转换 成 了 对 数 收 益 率 . 总 
共有 696 个 观测 值 . 正如 例 9.2 中 显示 的 , 数据 具有 序列 依赖 性 . 然而 , 通过 拟 合 一 
个 VARMA(2,1) 模型 来 消除 序列 依赖 几乎 不 对 同步 相关 和 矩阵 具有 任何 影响 . 事实 
E, 拟 合 一 个 VARMA(2,1) 模型 之 前 和 之 后 的 相关 矩阵 分 别 为 


1.0 1.0 
0.98 1.0 0.98 1.0 
Êo = | 0.92 0.91 1.0 è $= 10.92 02929 1.0 
0.85 0.86 0.90 1.0 0.85 0.86 0.90 1.0 
0.63 0.64 0.67 O81 1.0 0.66 0.67 0.71 0.84 1.0 


其 中 po 是 原始 对 数 收益 率 的 相关 和 矩阵， 因此 , 我 们 直接 对 收益 率 序列 应 用 因子 
分 析 . 

表 9-5 中 给 出 了 数据 因子 分 析 的 结果 . 对 两 种 估计 方法 , 前 两 个 公共 因子 对 数 
据 总 方差 的 解释 都 超过 了 90%， 事 实 上 , 高 的 共性 方差 说 明 对 五 种 债券 指数 收益 
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率 而 言 , 其 个 性 方差 都 非常 小 . 因为 两 种 方法 的 结果 接近 , 故我 们 只 讨论 主 成 分 方 
法 . 非 旋转 因子 负荷 说 明 : (a) 所 有 5 种 收益 序列 对 第 一 个 因子 的 负荷 粗略 地 相等 ; 
(b) 对 第 二 个 因子 的 负荷 与 期 限 长 短 是 正 相 关 的 . 因此 , 第 一 个 公共 因子 代表 了 一 
般 的 美国 债券 收益 率 , 第 二 个 因子 体现 了 “期 限 ” 效 应 . 而 且 , 第 二 个 因子 负荷 的 和 
接近 于 0. 因此 , 这 个 公共 因子 也 可 以 解释 为 长 期 债券 与 短期 债券 的 比较 . 这 里 一 
个 长 期 债券 指 的 是 期 限 为 10 年 或 更 长 的 债券 . 对 旋转 后 的 因子 , 其 负荷 也 是 有 趣 
的 . 对 第 一 个 旋转 因子 的 负荷 与 期 限 成 正比 例 , 而 对 第 二 个 因子 的 负荷 与 期 限 成 反 
比例 . 


R 9-5 期 限 为 30 年 20 年 、 10 年 ,5 年 和 1 年 的 美国 债券 指数 的 月 对 数 收 蔓 率 的 因子 分 析 7 
变量 因子 负荷 的 估计 旋转 因子 负荷 


共性 方差 
fi fa I I2 l1—o$ 
主 成 分 法 

30 年 0.952 0.253 0.927 0.333 0.970 
20 年 0.954 0.240 0.922 0.345 0.968 
10 年 0.956 0.140 0.866 0.429 0.934 
5 年 0.955 —0.142 0.704 0.660 0.931 
1 年 0.800 一 0.585 0.325 0.936 0.982 
变量 4.281 0.504 3.059 1.726 4.785 
比例 0.856 0.101 0.612 0.345 0.957 

最 大 似 然 法 
30 年 0.849 一 0.513 0.895 0.430 0.985 
20 年 0.857 —0.486 0.876 0.451 0.970 
10 年 0.896 一 0.303 0.744 0.584 0.895 
5 年 1.000 0.000 0.547 0.837 1.000 
i 年 0.813 0.123 0.342 0.747 0.675 
变量 3.918 0.607 2.538 1.987 4.525 
比例 0.784 0.121 0.508 0.397 0.905 


a 时 间 基 从 1942 年 1 月 到 1999 年 12 A. 分 析 基 于 样本 交叉 相关 阵 ， 假定 有 两 个 公共 因子 . 


例 9.4 再 一 次 考虑 表 9-2 中 的 10 只 股票 的 月 超额 收益 率 . 时 间 区 间 是 从 1990 
年 1 月 到 2003 年 12 A, 收益 率 以 百分比 的 形式 给 出 . 我 们 的 目的 是 用 S-Plus 命 
令 factanal 演 示 一 下 统计 因子 模型 的 应 用 . 我 们 从 二 因子 模型 开始 , 但 是 (9.20) 式 
的 似 然 比 检验 拒绝 了 二 因子 模型 的 假设 . 检验 统计 量 是 LR(2)—72.96. 基于 自由 度 
26 的 渐 近 卡 方 分 布 , 检验 统计 量 的 p 值 接 近 为 零 . 


> dasmatrix(scan(file-'m-barra-9003.txt'),10) 
> rtn=t (da) 
> stat.fac-factanal(rtn,ftactors-2,method-'mle') 
> stat.fac 
Sums of squares of loadings: 
Factorl Factor2 
2.696479 2.19149 


Component names: 
"loadings" "uniquenesses" "correlation" "criteria" 
"factors" "dof" "method" "center" "scale" "n.obs" 
"scores" "call" 
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接着 应 用 一 个 三 因子 模型 , 在 5% 的 显著 性 水 平 下 该 模型 似乎 是 合理 的 . LR(3) 统 
计量 的 p 值 是 0.089 2. 


> Stat .fac=factanal(rtn, factor=3,method=’mle’) 

> stat.fac 

Test of the hypothesis that 3 factors are sufficient 
versus the alternative that more are required: 

The chi square statistic is 26.48 on 18 degrees of freedom. 
The p-value is 0.0892 


> summary (stat .fac) 
Importance of factors: 


Factori Factor2 Factor3 


SS loadings 2.635 1.825 1.326 
Proportion Var 0.264 0.183 0.133 
Cumulative Var 0.264 0.446 0.579 
Uniquenesses: 

AGE C MWD MER DELL HPQ IBM 


0.479 0.341 0.201 0.216 0.690 0.346 0.638 
AA CAT PG 
0.417 0.000 0.885 


Loadings: 
Factorl Factor2 Factor3 
AGE 0.678 Qi 和 0. I2 


C 0.739 0.259 0.213 
MWD 0.817 0.356 

MER 0.819 0.329 

DELL 0.102 0.547 

HPQ 0.230 0.771 

IBM 0.200 0.515 0.238 
AA 0.194 0.546 0.497 
CAT 0.198 0.138 0.970 
PG 0.331 


因子 负荷 也 可 以 用 下 述 命令 >plot(loadings(atat ,fac)) 在 图 上 表示 出 来 即 图 
9-6， 从 图 中 可 以 看 出 因子 1 本 质 上 代表 金融 服务 类 , 而 因子 2 主要 由 高 科技 类 
和 Alcoa 股票 的 超额 收益 率 构成 , 因子 3 很 大 程度 上 依赖 于 CAT 股票 和 AA 股票 
的 超额 收益 率 , 因此 代表 剩余 的 产业 股 . 


用 命令 rotate 可 以 进行 因子 旋转 . 该 命令 允许 许多 种 旋转 方法 . 由 命令 predict 
可 以 得 到 因子 实现 . 


> Stat.fac2 = rotate(stat.fac, rotation=’ quartimax’ ) 
> loadings (stat. fac2) 

Factor1 Factor2 Factor3 
AGE 0.700 0.171 


c 0.7 72 0.216 0.124 
MWD 0.844 0.291 
MER 0.844 0.264 
DELL 0.144 0.536 
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HPQ 0 
IBM 0 
AA 0 
CAT 0 
PG 0 
> facto 


.294 0-753 
-258 0.518 0.164 
.278 0.575 0.418 


293 0.219 0.931 
.334 


r.real-predict(stat.fac,type-'weighted.ls') 


最 后 基于 所 拟 合 的 三 因子 统计 因子 模型 可 以 得 到 这 10 只 股票 超额 收益 率 的 相 
关 和 矩阵 . 如 所 料想 , 与 9.3.1 节 的 产业 因子 模型 所 得 到 的 相关 和 矩阵 相 比 , 此 处 得 到 的 
相关 甜 阵 与 样本 相关 和 矩阵 的 对 应 部 分 更 接近 . 可 以 用 GMVP 来 比较 收益 率 和 统计 
因子 模型 的 协 方差 矩阵 - 


> corr. 


fit=fitted(stat.fac) 


> print (corr.fit,digits=1,width=2) 


à 
问 
HB 


ooooocco & 
TR GE . 


AGE C MWD MER DELL HPQ IBM AA CAT PG 
.0 0.6 0.6 0.6 0.19 0.3 0.3 0.3 0.3 0.2 
S 1,0 0447 (0.7 0:22 9,4 9.3: 0. & 0,4 10.3 
6 0.7 1.0 0.8 0.28 0.5 0.4 0.4 0.3 0.3 
.6 0.7 0.8 1.0 0.26 0.5 0.4 0.4 0.3 0.3 
.2 0.2 0.3 0.3 1.00 0.5 0.3 0.3 0.1 0.0 
3 0.4 0.5 0.4 0.45 1.0 0.5 0.5 0.2 0.1 
3 0.3 0.4 0.3 0.31 0.5 1.0 0.4 0.3 0.1 
3 0.4 0.4 0.4 0.33 0.5 0.4 1.0 0.6 0.1 
3 0.4 0.3 0.3 0.11 0.2 0.3 0.6 1.0 0.1 
2 0.3 0.3 0.3 0.03 0.1 0.1 0.1 0.1 1.0 

WT 
0.8 
0.6 
0.4 
0.2 
0.0 
0.8 
0.6 
0.4 
0.2 
m MWD MER 
1. 因子 3 
u. 
0.6 
0.2 


ss CAT — AA IBM C AGE HPQ 


图 9-6 对 表 9.2 中 10 只 股票 的 月 超额 收益 率 拟 合 一 个 三 因子 模型 时 的 因子 负荷 图 
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到 现在 为 止 , 关于 PCA 的 讨论 都 是 假定 资产 的 个 数 小 于 所 考虑 时 期 的 个 数 ， 
BI k <T. 为 了 处 理 T BU k 较 大 的 情形 , Conner 和 Korajczyk(1986,1988) 提出 
了 渐 近 主 成 分 分 析 (APCA) 的 概念 . 该 方法 与 传统 的 PCA 相似 , 但 是 依赖 于 资产 
数目 趋 于 无 穷 时 的 渐 近 结果 . 因此 APCA 是 基于 下 述 T x 矩阵 的 特征 值 _ 特 
征 向 量 分 析 : " 
Or = 一 y. - Ry, - By, 
k=] i=l 


其 中 R; 是 由 (9.3) 式 所 定义 的 第 i 个 资产 的 时 间 序 列 , R= (1/k) x > Ri. 换 言 
gal 
之 , R 是 所 用 股票 的 平均 收益 率 序 列 , 另外 , 用 (9.4) 式 的 符号 , 我 们 有 


1 p = 


其 中 1, 是 元 素 全 为 1 的 大 维 向量 , Conner 和 Korajezyk 证 明了 当 k FEJNI, 
对 Oey 的 特征 值 一 特征 向 量 分 析 等 价 于 传统 的 统计 因子 分 析 . 换言之 , 因子 f, 的 
APCA 估计 是 Pr 的 前 m 个 特征 向 量 . + P. 表示 由 Pr 的 前 mm 个 特征 向 量 构 成 
W m x T FARE, WW f, d& F, 的 第 t 列 . 利用 类 似 于 估计 BARRA 因子 模型 的 思想 ， 
Conner 和 Korajezyk(1988) 建议 按 如 下 步骤 修正 估计 Fe: 

(1) 对 上 = 二 … ,T, 利用 样本 协 方差 矩阵 Orr 得 到 初始 估计 F,; 

(2) 对 每 个 资产 , 给 出 模型 


ra =a + BF, + Eit t=1,---,T, 


的 OLS 估计 , 并 计算 残 差 的 方差 67. 
(3) 构造 对 角 和 矩阵 D = diag{63,… 02), 并 且 将 收益 率 进行 如 下 刻度 变换 


R= RD. 


(4) 利用 R. tA PRT x T 协 方差 矩阵 
2, = Ec D B, ® 1,)(2, TN R, & th)"; 
其 中 R. 是 由 OR. 的 行内 平均 值 所 构成 的 向 量 , 然后 对 OL 进行 特征 值 — 特征 向 
量 分 析 来 得 到 f, 的 修正 估计 . 
9.6.1 因子 个 数 的 选择 


文献 中 有 两 种 方法 来 选择 因子 分 析 中 因子 的 个 数 . 第 一 种 方法 是 由 Conner 和 
Korajezyk(1993) 提出 的 . 该 方法 所 用 的 思想 是 如 果 m 是 正确 的 因子 个 数 , 则 当 因 
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子 个 数 从 m 变 到 m +1 时 资产 个 性 误差 sx 的 横 截面 方差 应 该 不 会 显著 下 降 . 第 
二 种 方法 是 Bai 和 Ng(2002) 提出 来 的 . 该 方法 采用 一 些 信息 准则 来 选择 因子 个 数 . 
后 一 种 方法 基于 这 样 一 个 观测 到 的 事实 : Or 的 特征 值 一 特征 向 量 分 析 求 解 出 了 
下 述 最 小 二 乘 问题 
k T 
假定 存在 m 个 因子 , W f, 是 m 维 的 . 令 am) 表示 对 资产 i 进行 前 面 的 最 小 一 
乘 问题 的 组 内 回归 的 残 差 的 方差 , 这 里 要 利用 APCA 分 析 中 得 到 的 f,. 定义 残 差 
的 横 截 面 方差 如 下 : 


] k 
a?(m) = z Xâ? (m). 
= 
Bai 和 Ng(2002) 给 出 的 准则 是 
T 
Cia(m) = 6?(m) + mê? (M) (E) In (Er) ; 


Cyz(m) = 6? (m) + mô? (M) (r) In (Per) ， 
其 中 M 是 事先 指定 的 正 整 孝 , 它 表 示 因 子 的 最 大 个 数 ; Per = min(v/k, VT). 使 得 
Cyi(m) 或 Crz(m) 最 小 的 m 便 是 我 们 所 要 选择 的 因子 个 数 , 这 里 0< m <M. 实 
际 中 , 这 两 个 准则 可 能 会 选择 不 同 的 因子 个 数 . 


9.6.2 ”例子 


为 了 进一步 说 明 渐 近 主 成 分 分 析 , 考虑 40 只 股票 的 月 简单 收益 率 , 时 间 区 间 
是 从 2001 年 1 月 到 2003 Æ 12 H, 共 36 个 观测 . 于 是 我 们 有 大 = 40, T = 36. X 
9-6 给 出 了 这 些 股票 的 代码 . 这 些 股票 是 在 2004 年 9 月 份 的 某 一 天 在 NASDAQ 和 
NYSE 中 交易 频繁 的 股票 . 主要 用 到 的 S-Plus 命令 是 mfactor. 


表 9-6 渐 近 主 成 分 分 析 中 所 用 到 的 股票 的 代码 , 样本 时 间 区 间 是 从 
2001 年 1 月 到 2003 年 12 月 


Tick Symbol 


NASDAQ 
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我 们 用 前 面 所 讨论 的 两 种 方法 来 选择 因子 个 数 . Conner 和 Koraiczyk 提出 的 
方法 选择 了 m = 1, 而 Bai 和 Ng 提出 的 方法 选择 了 m = 6. 对 于 后 一 种 方法 , Wi 


个 准则 给 出 了 不 同 的 选择 . 
> dim(rtn) $% rtn is the return data. 
[1] 36 40 
> nf.ck-mfactor(rtn,k-'ck',max.k-10,5ig-0.05) 
s nf.ck 
Call: 


mfactor(x = rtn, k = "ck", max.k = 10, sig = 0.05) 


Factor Model: 
Factors Variables Periods 
1 40 36 
Factor Loadings: 
Min. ist Qu. Median Mean 3rd Qu. Max, 
F.1 0.069 0.432 0.629 0.688 1.071 1.612 


Regression R-squared: 
Min. 1st Qu. Median Mean 3rd Qu. Max. 

0.090 0.287 0.487 0.456 0.574 0.831 

> nf.bnemfactor(rtn,ks-s'bn',max.k-10,sig-0.05) 
Warning messages: 
Cpl & Cp2 did not yield same result.The smaller one is used. 
» nf.bn$k 

[1] 6 


取 m = 6, 我 们 对 收益 率 序列 应 用 APCA 可 以 得 到 斜坡 图 和 被 估 收 益 率 因子 . 


> apca = mfactor(rtn,k-6) 

> apca 
Call: 
mfactor(x = rtn, k = 6) 

Factor Model: 

Factors Variables Periods 

6 40 36 
Factor Loadings: 
Min lst Qu. Median Mean 3rd Qu. Max. 


F.1 0.048 0.349 0.561 0.643 0.952 2.222 
B. -1.737 0.084 0.216 0.214 0.323 1.046 
1 «2.542 0.002 0.076 0.102 6.255: 1.093 
F,4 -0.965 -0.035 0.078 0.048 0.202 0.585 
F.5 -0.722 -0.008 0.056 0.066 0.214 0.729 
P: -0.840 -0.088 0.003 0.003 0.071 0.635 


Regression R-squared: 
Min. 1st Qu. Median Mean 3rd Qu. Max. 
0.219 0.480 0.695 0.651 0.801 0.999 


> screeplot.mfactor (apca) 
> fplot (factors (apca) ) 


图 9-7 给 出 了 40 支 股票 收益 率 的 APCA 的 斜坡 图 . 6 个 公共 因子 大 约 解 释 了 
变化 的 89.4%. 图 9-8 给 出 了 6 个 被 估 因 子 的 时 间 图 . 
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图 9-7 对 40 只 股票 的 月 简单 收益 率 进 行 APCA 的 斜坡 图 . 样本 时 间 区 间 是 从 2001 年 1 
月 到 2003 年 12 月 
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图 9.8 对 40 只 股票 的 月 简单 收益 率 进 行 APCA 所 得 到 的 因子 收益 的 时 间 图 .样本 时 间 区 
间 是 从 2001 年 1 月 到 2003 年 12 月 


练 习 题 


9.1 考虑 Merck&Company, Johnson&Johnson, General Electric, General Motors, Ford Mo- 
tor Company 股票 以 及 市 值 加 权 指 数 的 月 对 数 收益 率 . 收益 率 以 百分比 的 形式 给 出 并 且 包 
括 分 红 , 时 间 区 间 是 从 1960 年 1 月 到 1999 年 12 H. 数据 在 文件 m-mrk2vw.txt 中 , 共有 
6 Fil, 且 排 列 顺 序 跟 前 面 列 出 的 一 样 . 
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(a) 用 样本 协 方差 矩阵 对 数据 进行 主 成 分 分 析 . 
(b) 用 样本 相关 算 阵 对 数据 进行 主 成 分 分 析 ， 
(c) 对 数据 进行 统计 因子 分 析 . 识别 公共 因子 的 个 数 , 并 利用 主 成 分 分 析 方 法 和 最 大 似 然 
方法 估计 因子 负荷. 

9.2 文件 m-excess-ci0sp-9003.txt 中 包含 10 只 股票 和 S&P500 指数 的 月 简单 超 物 收益 率 . 
利用 二 级 市 场 上 的 3 个 月 期 国库 券 利 浴 米 计算 超额 收益 . 样本 时 间 区 间 是 从 1990 年 1 月 
到 2003 年 12 A, 共 168 个 观测 . 文件 中 的 11 列 分 别 包 合 ABT, LLY, MRK, PFE, F, 
GM, BP, CVX, RD, XOM 和 S&P500 指数 的 超额 收益 率 . 利用 单 因子 市 场 模型 分 析 10 
只 股票 的 超额 收益 率 . 对 于 每 只 股票 , 画 出 其 beta 和 R? 的 估计 . 利用 全 局 最 小 方差 组 合 
比较 所 拟 合 模型 的 协 方差 矩阵 和 数据 的 样本 协 方差 矩阵 - 

9.3 再 次 考虑 文件 m-excess-ci0sp-9003.txt 中 10 只 股票 的 超额 收益 率 . 股票 来 自 三 个 产业 
WI]. APT, LLY, MRK 和 PFE 是 主要 的 制药 公司 , F 和 GM 是 汽车 公司 , 剩 下 的 为 大 
的 石油 公司 . 利用 BARRA 产业 因子 模型 分 析 这 些 超 额 收益 率 . 画 出 三 因子 实现 的 图 像 ， 
并 说 明 模 型 的 充分 性 . 

9.4 再 次 考虑 文件 m-excess-ci0sp-9003.txt 中 10 只 股票 的 超额 收益 率 , 对 其 进行 主 成 分 分 
析 并 画 出 斜坡 图 . 共有 几 个 公共 因子 ? 为 什么 解释 每 个 公共 因子 的 含义 . 

9.5 再 次 考虑 文件 m-excess-cl0sp-9003.txt 中 10 只 股票 的 超额 收益 率 , 对 其 进行 统计 因子 
分 析 , 在 5% 的 显著 性 水 平 下 要 用 到 多 少 个 公共 因子 ? 画 出 所 拟 合 模型 的 被 估 因 子 负 荷 图 . 
这 些 公共 因子 有 意义 吗 ? 

9.6 文件 m-fedip.txt 包 含 从 1954 年 7 月 到 2003 年 12 月 的 联邦 基金 有 效 年 利率 和 月 利率 以 
及 工业 生产 指数 . 工业 生产 指数 已 经 经 过 了 季节 调整 . 用 联邦 基金 利率 和 工业 生产 指数 作 
为 宏观 经 济 变 晶 为 文件 nm-excess-cl0sp-9003.tzxt 中 10 只 股票 的 超额 收益 率 拟 合 一 个 宏 
观 经 济 因子 模型 . 可 以 用 VAR 模型 来 得 到 宏观 经 济 变量 的 意外 序列 . 解释 所 拟 合 的 因子 
Bu. 
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第 10 章 多 元 波动 率 模型 及 其 应 用 


本 章 将 第 3 章 中 的 一 元 波动 率 模型 推广 到 多 元 情形 , 并 讨论 一 些 方法 来 简化 
多 个 资产 收益 率 波动 率 过 程 之 间 的 动态 关系 . 多 元 波动 率 在 金融 中 有 许多 重要 的 应 
FA. 它们 在 组 合 选择 与 资产 分 配 中 非常 重要 , 而 且 可 以 用 来 计算 包括 多 个 资产 的 金 
融 头 寸 的 风险 值 . 

考虑 多 元 收益 率 序 列 (n). 我 们 采取 与 一 元 情形 相同 的 方法 将 序列 改写 为 


Te = My + at, 


这 里 u, = E(ri| Fi) 是 zi 在 给 定 过 去 信息 五,_1 FARE, a; — (a1, aiu) 
是 序列 在 时 刻 的 扰动 或 新 息 . 假定 iu 过 程 服从 第 8 章 中 多 元 时 间 序 列 模型 的 条 
件 期 望 过 程 . 对 大 多 数 收益 率 序 列 , 对 pe, 采用 一 个 带 外 生变 量 的 简单 向 量 ARMA 
结构 就 足够 了 , 即 

fu = Yo, >P bir, i— >P 0;a,., (10.1) 


$—1 i=l 
这 里 a, 表示 m 维 外 生变 量 (MEZE) 向 量 , 其 中 zt = 1, TÆ kx m HER, H. 
p,q 为 非 负 整数 . 我 们 称 (10.1) HA m, 的 均值 方程 . 
ERE Fii 下 at 的 条 件 方差 矩阵 是 一 个 大 x 大 的 正定 矩阵 X, 定义 为 


L, = Cov(a;|F,..,). 


JURE BRON E, 随时 间 的 演变 . 我 们 对 X, 指定 一 个 模型 称 为 
收益 率 序 列 re 的 波动 率 模型 . 

将 一 元 波动 率 模型 推广 到 多 元 情形 有 许多 种 方法 . 但 是 维 数 所 带 来 的 “祸害 ” 
很 快 成 为 应 用 中 的 一 个 主要 阻碍 , 因为 对 一 个 大 维 收益 率 序列 而 言 , S 中 有 kk(k 十 
1)/2 个 量 . 为 进一步 说 明 , 对 于 一 个 5 维 的 收益 率 序列 , €, 中 有 15 个 条 件 方差 与 
条 件 协 方差 . 本 章 主 要 介绍 一 些 相 对 简单 的 多 元 波动 率 模型 . 它们 很 有 用 而 且 在 实 
际 应 用 中 容易 处 理 . 尤其 是 , 我 们 讨论 了 一 些 允 许 资产 收益 率 间 的 相关 系数 是 时 变 
的 模型 . 时 变相 关 性 在 金融 中 很 有 用 . 例如 , 它们 可 以 用 来 估计 一 个 收益 率 序列 市 
场 模型 的 时 变 系 数 B. 

10.1 节 首 先 用 指数 加 权 方 法 来 估计 协 方差 矩阵 . 这 样 估 计 的 协 方差 矩阵 可 以 
作为 多 元 波动 率 估计 的 基准 . 10.2 节 讨 论文 献 中 己 有 的 一 元 GARCH 模型 的 一 些 
推广 . 10.3 节 介 绍 两 种 波动 率 建 模 中 重新 参数 化 D, 的 方法 . 基于 Cholesky 分 解 的 
重新 参数 化 是 非常 有 用 的 . 10.4 WE GARCH 模型 为 例 研 究 了 二 元 收益 率 的 波动 
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率 模型 . 在 这 个 特例 中 , 波动 率 模型 可 以 是 二 维 或 三 维 的 . 10.5 节 主 要 关注 更 高 维 
收益 率 的 波动 率 模型 . 10.6 节 强 调 了 降低 维 数 的 问题 . 10.7 节 说 明了 多 元 波动 率 模 
型 的 一 些 应 用 . 最 后 , 10.8 节 给 出 了 对 波动 率 建 模 有 用 的 多 元 学 生 一 t 分 布 . 


10.1 ”指数 加 权 估 计 


给 定 新 县 集合 Fii = {a ,at-1}, 新 息 的 无 条 件 协 方差 矩阵 可 由 下 式 估 
计 : 
1 t—1 
2 = EI 2.2/0; 
这 里 a; 的 均值 理解 为 0. 该 估计 对 于 和 式 中 的 每 一 项 赋予 相同 的 权重 1/(t 一 1). 为 
了 允许 协 方差 有 时 变性 并 且 强 调 对 越 靠近 的 新 息 相 关 性 越 大 , 可 以 利用 指数 平滑 的 
思想 给 出 at 协 方差 矩阵 的 下 述 估计 : 


ERS: t—1 


>, m 13-4 M-la, jai (10.2) 
其 中 0 < 入 <1 且 权重 (1 一 和 和 N71/(1 — A73) 之 和 为 1. SEF WE AO 2 0 的 充 


分 大 的 前 面 的 估计 可 以 改写 为 
>, 一 (1 €: A)a1—104. 4 T AE. a. 


因此 , (10.2) 式 的 估计 称 为 协 方差 矩阵 的 指数 加 权 滑 动 平 均 (EWMA) 估计 . 

假定 收益 率 数据 为 {71,… rr}. 给 定 入 和 初始 估计 Xu, 则 X, 可 以 递归 计算 
出 来 . 车 假定 a, = r — po, 服从 均值 为 0、 协 方差 矩阵 为 Y, 的 多 元 正 态 分 布 (这 
里 jv, 是 参数 日 的 函数 ), 则 可 以 用 最 大 似 然 方法 联合 估计 出 A 和 日 , 这 是 因为 数 
据 的 似 然 函 数 是 

T T 
In L(@,2) x -53 Inu) = 5 3 i - MBE (re m. 

用 X, 代替 x, 可 以 递归 地 估算 出 上 式 . 
例 10.1 为 进一步 说 明 , 考虑 香港 和 日 本 的 股票 市 场 指数 的 日 对 数 收益 率 . 时 间 
区 间 是 从 199%6 年 1 月 1 日 至 1997 年 10 H 16 H, 4 469 个 观测 值 . 指数 以 美元 度 
TH. 且 收 益 率 以 百分比 形式 给 出 . 选择 这 个 样本 段 是 为 了 避免 亚洲 金融 危机 的 影响 . 
该 危机 在 1997 年 10 月 17 日 冲击 了 香港 市 场 . 数据 来 自 于 数据 流 (Datastream). 
10-1 给 出 了 两 个 指数 收益 率 的 时 间 图 . 令 ri, 为 香港 股票 市 场 的 指数 收益 率 , ro, 
为 日 本 股票 市 场 的 指数 收益 率 . 如 果 采 用 一 元 GARCH 模型 , 则 我 们 得 到 以 下 模型 


rit = 0.090 — 0.09417) ¢-6 + Ait, Git = O12E 18; 


A : : (10.3) 
Oit = 0.126 十 0.103a1 ,. 十 0.81807 , 4, 
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T2, = —0.046 十 aa2t， à21 一 82:£21. 
o3, = 0.007 + 0.05402, , + 0.94262 , ,. 


其 中 除了 收益 率 序列 的 常数 项 和 日 本 市 场 收 益 率 的 ao 以 外 的 所 有 参数 的 估计 在 
5% 的 水 平 下 都 是 显著 的 , 上 述 两 个 一 元 模型 的 标准 化 残 差 与 残 差 平方 序列 的 Ljung- 
Box 统计 量 并 没有 表明 模型 的 任何 不 充分 性 . 图 10-2 给 出 了 前 面 两 个 一 元 GAR- 
CH(1,1) 模型 的 波动 率 估计 . 香港 股票 市 场 看 上 去 比 日 本 股票 市 场 有 更 大 波动 性 . 
但 是 日 本 市 场 在 后 半 部 分 样本 中 显示 了 波动 率 递 增 的 趋势 .香港 市 场 和 日 本 市 场 
指数 收益 率 基 于 模型 的 渐 近 标准 差分 别 是 1.259 和 1.393. 数据 的 样本 标准 误差 分 
别 是 1.296 和 1.067. 因此 , 日 本 市 场 指数 收益 率 的 一 元 模型 过 度 估 计 了 无 条 件 波动 
率 . 这 可 能 是 由 于 (10.4) 式 中 IGARCH 模型 的 特征 引起 的 , 而 IGARCH 模型 特征 
的 出 现 又 可 能 是 由 于 所 观测 到 的 数据 后 半 部 分 波动 率 的 跳跃. 


(10.4) 


(a) 香港 
6 
Æ 5 
E 
E a4 
Rs 
0 100 200 300 400 
天 
(b) 日 本 
4 
E 
Eq 
- 
s Ü 100 200 300 400 


K 
图 10-1 香港 和 日 本 股票 市 场 指 数 的 日 对 数 收 益 率 的 时 间 图 . 时 间 区 间 是 从 1996 年 1 月 1 日 
到 1997 年 10 月 16 日 , 收益 率 以 百分比 形式 给 出 : (a) 香港 市 场 ; (b) 日 本 市 场 


接 下 来 看 二 元 模型 . 为 了 简单 , 我 们 忽略 掉 香 港 市 场 收 益 率 延迟 为 6 的 小 的 序 
列 相关 性 , 并 且 用 EWMA 方法 来 得 到 波动 率 估 计 , 这 要 用 到 S-Plus FinMetrics 中 
的 命令 mgarch: 


> hkja.ewma=mgarch 1, formula.var = ~ ewmal, trace = F) 
Mean Equation: rtn ~ 1 


Conditional Variance Equation: ~ ewmal 

Coefficients: 

C(1) 0.06394 % Expected perc. return of Hong Kong market 
C(2) -0.05478 % Expected perc. return of Japanese market 
ALPHA 0.03711 


A 的 估计 是 1 一 4 = 1 一 0.037 11 ~ 0.963. 该 值 处 于 实际 中 常见 的 范围 内 . 图 
10-3 给 出 了 用 EWMA 方法 估计 出 的 波动 率 序 列 . 与 图 10-2 相 比 较 , EWMA 方法 
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给 出 的 波动 率 序列 更 为 平滑 , 尽管 在 这 两 幅 图 中 波动 率 具有 相似 的 形式 . 


(a) 香港 
3.0 
225 
S5 290. | 
1.5 
1.0 NE 
0 100 200 300 400 
天 
(b) HÆ 


ü 100 200 300 400 


at 
PONA 
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图 10-2 ”香港 和 日 本 股票 市 场 指数 日 对 数 收益 率 的 波动 率 (标准 误差 ) 的 估计 值 . 时 间 区 间 
是 从 1996 年 1 月 1 日 到 1997 年 10 H 16 H, 收益 率 以 百分比 给 出 : (a) 香港 市 
场 ; (b) 日 本 市 场 . 所 用 的 模型 是 一 元 模型 


(a) 香港 


at 
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图 10-3 ”香港 和 日 本 股票 市 场 指数 的 日 对 数 收 益 率 波动 率 (标准 误差 ) 估计 的 时 间 图 ， 时 
间 区 间 是 从 1996 年 1 月 1 日 到 1997 年 10 H 16 A, 收益 率 以 百分比 形式 给 出 ; 
(a) 香港 市 场 ; (b) 日 本 市 场 . 用 到 了 指数 加 权 滑 动 平 均 方 法 


10.2 多 元 GARCH 模型 


很 多 作者 已 经 把 一 元 GARCH 模型 推广 到 多 元 情形 . 本 节 将 讨论 这 些 推广 中 
的 一 部 分 . 更 多 的 细节 , 读者 可 以 参考 最 近 的 综述 性 文献 ， 如 Bauwens, Laurent 和 
Rombouts(2004). 
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10.2.1 对 角 VEC 模型 


Bollerslev, Engle 和 Wooldridge(1988) 推广 了 指数 加 权 滑 动 平均 方法 并 提出 了 
下 述 模型 ， l 
Xi = Ao t+) A; © (aiat) + > Bj © Xi, (10.5) 
人 


j=) 


其 中 m 和 s 是 非 负 整数 , 4A; 和 B; 是 对 称 和 矩阵, © 表示 Hadamard 乘积 , 即 和 矩阵 的 
相应 元 素 相 乘 . (10.5) 式 称 为 对 角 VEC(m, s) 模型 或 DVEC(m, s) 模型 . 为 了 进 一 
步 理 解 该 模型 , 考虑 满足 下 述 关 系 式 的 二 元 DVEC(1, 1) 模型 


O11,t 2d A0 
021,4 0224 A21,0 A22,0 
2 
Aia «| 011-4 
is 2 
Aoi A224 Q11—:02,—1 QZ 


n | Bii, | 6 | 0114. 1 | 
Boii B221 7214—1  O022,4—1 
这 里 只 给 出 了 模型 的 下 三 角 部 分 . 模型 可 以 具体 写 为 


Giit = Å11,0 + A1110] 4 + Biji ts 


十 


821,£— Azi0 + A91,101,4 102,43 + B213102141, 


022,4. = 22,0 + Az2,103 , 1 十 B22102241; 


其 中 x, 的 元 素 只 依赖 于 其 过 去 值 和 a, 1a, , 中 的 乘积 项 . 也 就 是 说 , DVEC 模型 
的 每 个 元 素 都 服从 GARCH(1, 1) 模型 , 从 而 该 模型 很 简单 . 然而 , 它 可 能 产生 一 个 
非 正 定 的 协 方差 矩阵 . 进一步 地 , 模型 不 允许 波动 率 序 列 之 间 的 动态 依赖 性 . 

例 10.2 为 了 进一步 说 明 , 考虑 两 个 烟草 公司 的 月 简单 收益 率 序列 (包含 分 红 ). 
时 间 区 间 是 从 1965 年 1 月 到 2003 年 12 H, 共有 468 个 观测 . 令 rt 表示 Pfizer 股 
票 的 收益 率 , ro, 表示 Merck 股票 的 收益 率 . 图 10-4 给 出 了 二 元 序列 Ti = (rit, Tat)’ 
的 时 间 图 . 图 像 表明 该 二 元 序列 没有 显著 的 序列 相关 性 . 因此 , r 的 均值 方程 只 包 
含 常数 项 . 在 S-plus 的 FinMetrics 中 , 用 命令 mgarch 给 序列 拟 合 一 个 DVEC(1, 1) 
模型 . 


> rtn=cbind(pfe,mrk) % Output edited. 
> drug.dvec=mgarch (rtn~1,~dvec(1,1)) 
> summary (drug. dvec) 


Call: 

mgarch(formula.mean = rtn ~ 1, formula.var = ~ dvec(1, 1)) 
Mean Equation: rtn ~ 1 

Conditional Variance Equation: ~ dvec(1, 1) 


Conditional Distribution: gaussian 


Estimated Coefficients: 
Value Std.Error t value Pr(>|t|) 
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C(1) 0.0164424 3.422e-03 4.805 1.047e-06 

C(2) 0.0150987 3.139e-03 4.810 1.025e-06 

A(1, 1) 0.0008181 4.348e-04 1.881 3.027e-02 

A(2, 1) 0.0001021 4.979e-05 2.050 2.048e-02 

A(2, 2) 0.0001408 7.067e-05 1.992 2.348e-02 
ARCH(1; 1, 1) 0.0727734 2.973e-02 2.448 7.363e-03 
ARCH(1; 2, 1) 0.0259816 9.537e-03 2.724. 3,343e-03 
ARCH(1; 2, 2) 0.0518917 1.753e-02 2.961 1.614e-03 
GARCH(1; 1, 1) 0.7777585 9.525e-02 B.165 1.554e-15 
GARCH(1; 2, 1) 0.9407037 2.191e-02 42.928 0.000e«00 
GARCH(1; 2, 2) 0.9203388 2.684e-02 34.296 0.000e«00 


Ljung-Box test for standardized residuals: 
Statistic P-value Chi^2-d.f. 

pfe 10.07 0.6096 12 

mrk 14.91 0.2461 12 


Ljung-Box test for squared standardized residuals: 
Statistic P value Chi^2 d.f. 


pfe 18.30 0.1068 12 
mrk 5.04 0.9566 12 
» names (drug.dvec) 
[1] "residuals" "sigma.t" "df.residual" "coef" 
[5] "model" "cond.dist" "likelihood"  "opt.index" 
[9] "cov" "std.residuals" "R.t" "E dz" 
[13] "prediction" "call" "series" 
(a) PFE 收益 率 
0.4 
证 0.2 
= 
x» 0,0 
0.2 
1970 1980 1990 2000 
年 
(b) MRK 收益 率 
0.3 
Oo 
* 2 
X8 0.1 
zi 0.0 
—0.2 
1970 1980 1990 2000 
年 


图 10-4 Pfizer 股票 和 Merck 股票 月 简单 收益 率 (包含 分 红 ) 的 时 间 图 . 时 间 区 间 是 从 1965 
年 1 月 到 2003 年 12 A: (a) Pfizer 股票 ; (b) Merck 股票 


从 输出 结果 来 看 , 所 有 的 参数 估计 在 5% 的 水 平 下 都 是 显著 的 , 所 拟 合 的 波动 


率 模型 为 
oilt 一 0.00082 + 0.073a2 ,.., + 0.778011,4—1, 


021,t— 0.00010 十 0.026a 1.102,11 T 0.941091 4-1, 
0221 = 0.00014 + 0.05203 ，1 十 0.920022 11. 
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输出 结果 还 给 出 了 一 些 对 单 只 股票 收益 率 进行 模型 检验 的 统计 量 . 例如 , Pfizer 股 
票 收 益 率 的 标准 残 差 序列 和 标准 残 差 平 方 序列 的 Ljumg-Box 统计 量 分 别 为 0(12) = 
10.07(0.61) 和 Q(12) = 18.30(0.11), 这 里 括号 内 的 数字 表示 p (A. 这 样 , 对 两 个 收益 
率 序 列 逐 个 检查 所 拟 合 的 模型 , 不 能 拒绝 DVEC(1, 1) 模型 一 种 包含 更 多 信息 的 
模型 检验 方法 是 对 该 二 元 收益 率 序列 的 标准 残 差 和 标准 残 差 平 方 序列 应 用 多 元 Q 
统计 量 . 对 于 这 个 特定 的 DVEC(1, 1) 模型 , 我 们 有 Q2(10) = 42.04(0.38), Q5(10) = 
67.33(0.004), 其 中 Q5 表示 二 元 标准 残 差 平方 序列 的 Q 统计 量 . 基于 二 元 统计 量 ， 
在 5% 的 显著 性 水 平 下 均值 方程 是 充分 的 , 然而 在 1% 的 水 平 下 , 拒绝 了 波动 率 服 
从 DVEC(1, 1) 模型 的 假设 . 图 10-5 给 出 了 所 拟 合 波动 率 和 相关 系数 序列 的 时 间 
PA. 这 些 序列 分 别 在 ‘sigma.t” 和““R.t?， ?中 进行 了 分 类 . 相关 系数 的 变化 范围 是 
0.42~0.84. 


(a) PFE 波动 率 
0.12 
.. 0.10 
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0.06 
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图 10-5 ”为 两 个 主要 烟草 公司 的 月 简单 收益 率 序列 拟 合 (1, 1) 模型 时 的 被 估 波 动 率 和 被 估 
时 变相 关系 数 的 时 间 图 . 时 间 区 间 是 从 1965 年 1 月 到 2003 年 12 月 : (a) Pfizer 
股票 波动 率 ; (b) Merck 股票 波动 率 ; (c) 时 变相 关系 数 
10.2.2 BEKK 模型 
为 了 保证 正定 性 限制 , Engle 和 Kroner(1995) 提出 了 如 下 BEKK 模型 : 
X, = AA’ + s A;(a,—;a, ,) AL + ECT D1; Bi, (10.6) 


i=] j=l 


其 中 A 是 下 三 角 和 矩阵 且 A 和 B, 是 大 x 大 和 矩阵. 基于 模型 的 对 称 参数 化 , 若 AA’ 
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是 正定 的 , 则 D, 几乎 处 处 正定 . 该 模型 允许 波动 率 序列 之 间 有 动态 依赖 性 . 另 一 
方面 , 模型 有 几 个 缺点 . 第 一 , A 和 B; 中 的 参数 关于 股票 或 波动 率 的 延迟 值 没 有 
直接 的 解释 ; 第 二 , 参数 的 个 数 是 k (m 十 s) 4- k(k 4- 1)/2, 它 会 随 m RI s 的 增 大 而 
迅速 增 大 . 有 限 的 经 验 表明 许多 被 估 参 数 都 是 统计 不 显著 的 , 这 使 得 在 建 模 中 存在 


ARI E VER. 


£j 10.3 为 了 进一步 说 明 , 考虑 例 10.2 中 Pfizer 股票 和 Merck 股票 的 月 简单 收 


益 率 , 并 对 它们 应 用 BEKK(1,1) 模型 . 再 一 次 用 S-plus 进行 估计 . 


> drug.bekk=mgarch (rtn~1,~bekk(1,1) ) 


> summary (drug .bekk) 
Call: 


mgarch(formula.mean = rtn ~ 1, 


Mean Equation: rtn ~ 1 


Conditional Variance Equation: 


Conditional Distribution: 


Estimated Coefficients: 


Value Std.Error 


C(1) 0.0164770 

C(2) 0.0142816 

A(1, 1) 0.0245803 

A(2, 1) 0.0116134 

A(2, 2) 0.0002018 
ARCH(1; 1, 1) 0.2994052 
ARCH(1; 2, 1) 0.1952856 
ARCH(1; 1, 2) -0.0818745 
ARCH(1; 2, 2) 0.0929540 
GARCH(1; 1, 1) 0,8987843 
GARCH(1; 2, 1) -0.0674587 
GARCH(1; 1, 2) 0.0163848 
GARCH(1; 2, 2) 0.9889547 


0. 
.003172 
.008837 
.005953 
.267625 
.093304 
.075092 
.097810 
.082626 
.074407 
.059595 
.046402 
.040158 


oOooococooocooococso 


003470 


1 


NODNPFPN PS 


formula.var = 


gaussian 


t value 


-749e+00 
.503e«00 
. 782e+00 
-951e+00 
.541e-04 
.209e«00 
-601e+00 
.371e-01 
.125e+00 
.208e«01 
.132e+00 
.531e-01 
.463e401 


Ljung-Box test for standardized residuals: 
Statistic P-value Chi^2-d.f. 


pfe 10.13 0.6044 
mrk 15.25 0.2278 


12 
12 


~ bekk(1, 1)) 


Pr (»|t]|) 
.369e-06 
.255e-06 
.815e-03 
.584e-02 
.997e-01 
.125e-04 
.802e-03 
.015e-01 
.306e-01 
.000e+00 
.291e-01 
.621e-01 
.000e+00 


Ljung-Box test for scuared standardized residuals: 
Statistic P-value Chi^2-d.f. 


pfe 18.314 0.1065 
mrk 7.174 0.8459 


S-plus 给 出 的 基于 单个 残 差 序列 的 模型 检验 统计 量 不 能 说 明 所 拟 合 的 BEKK(1,1) 
模型 是 不 充分 的 . 用 二 元 标准 化 残 差 ， 我 们 有 Q2(10) = 41.57(0.40),Q3(10) = 
65.71(0.006)， 类 似 于 DVEC(1,1) 模型 , 在 1% 的 显著 性 水 平 下 Ljung-Box 统计 量 
拒绝 了 该 波动 率 模型 . 图 10-6 给 出 了 所 拟 合 的 波动 率 序列 和 BEKK(1,1) 模型 的 时 
变相 关系 数 . 与 图 10-5 比较 , 这 两 个 拟 合 的 波动 率 模型 之 间 确 实 存在 差别 . 例如 ， 


12 
12 


BEKK(1,1) 模型 的 时 变相 关系 数 似乎 波动 更 大 . 
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图 10-6 ”为 两 个 主要 烟草 公司 的 月 简单 收益 率 序列 拟 合 BEKK(1, 1) 模型 时 的 被 估 波 动 率 
(标准 差 ) 和 被 估 时 变相 关系 数 的 时 间 图 . 时 间 区 间 是 从 1965 年 1 月 到 2003 年 12 
H; (a) Pfizer 股票 波动 率 ; (b) Merck 股票 波动 率 ; (c) 时 变相 关系 数 


BEKK (1,1) 模型 的 波动 率 方程 为 
O11,t C12, 0.025 0 0.025 0.012 
0231: 022, 0.012 0.0002 0 0.0002 
0.299 —0.082 ai 014 102,4—1 0.209 0.195 
0.195 0.093 一 0.082 0.093 


2 
Q2,:1—101,—1 54-4 


0.899 0.016 Ot= OGCi121—1 0.899 —0.067 
—0.067 0.989 0214—1 0224-1 0.006 0.989 | ' 


其 中 有 6 个 参数 的 估计 在 5% 的 水 平 下 都 是 不 显著 的 . 特别 地 , 常数 矩阵 4 仅 包含 
一 个 显著 的 参数 . 进一步 , 我 们 需要 进行 矩阵 的 乘积 来 解释 所 拟 合 的 模型 


10.3 ”重新 参数 化 
给 多 元 波动 率 建 模 时 有 用 的 一 步 就 是 利用 x. 的 对 称 性 将 其 重新 参数 化 . 我们 


AIR E, 的 两 种 重新 参数 化 方法 . 
10.3.1 ”相关 系数 的 应 用 


Xf x, 的 第 一 种 重新 参数 化 方法 是 利用 at 的 条 件 相关 系数 和 方差 . 具体 地 , 我 
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们 将 =, SA 
$i = [ci 一 Dip,Di, (10.7) 


其 中 p, 是 ar WPA, Di 是 k x k 对 角 矩 阵 , 其 元 素 为 ui 各 分 量 的 条 件 
标准 差 [Bl D, = diag{ YOT: *… ,VRH 

因为 p, 是 具有 单位 对 角 元 的 对 称 阵 , 所 以 2, 随时 间 演 变 是 由 条 件 方差 oia 
与 p, 的 元 素 pija 控制 的 , 其 中 c disk 因此 ,对 at 的 波动 率 建 模 只 要 
考虑 ai 的 条 件 方差 和 相关 系数 就 是 够 了 ,定义 k(k+1)/2 维 向量 


E, = (clt Ohkty Ot)» (10.8) 


其 中 o, 是 对 相关 和 矩阵 p, 进行 列 拉 直 得 到 的 k(k — 1)/2 维 向 量 , 但 是 只 利用 了 主 
对 角 下 面 的 元 素 . 具体 写 出 来 , 对 一 个 大 维 收益 率 序 列 ， 


Qi = (pic 1 PIyudlpa245777 s Pkt 7 PR 1) 


为 进一步 说 明 , 对 于 大 = 2, RITA o, = pays B. 
Ey = (o11,t; ca22,ty P2l,t) ， (10.9) 
它 是 一 个 3 维 的 向 量 . 对 上 = 3, 我 们 有 D, = (Pare palitypaai)' H. 
St = (011.1, 022,t;733,t; 921,5 P3i,ts 0324) ， (10.10) 


它 是 一 个 6 维 的 随机 向 量 . 
如 果 a, 是 二 元 正 态 随机 变量 , 则 m, 由 (10.9) TAH, MA a, 在 给 定 F4 
下 的 条 件 密度 函数 为 


E 1 011,021, € 
f (a1, a2|&y) m exp [ness 
214/011,4022,4 (1 — 951,4) (1 pha) 


ai a: 21,t01tQ2t 
其 中 QU aas R0) = SE + ze : M 
与 最 大 似 然 估计 有 关 的 a, 的 对 数 概 率 密 度 函 数 为 


= 1 1 a? az,  2posi4031a 

blar an, 8) =—= 4Wn[m11,/022, (1 —021,)]- ——2— (= ae Sees x) 
E 1 一 P214 N7114 / F222 /011,4022,t 

(10.11) 


这 个 重新 参数 化 是 很 有 用 的 , 因为 它 和 直接 对 协 方差 和 相关 阵 建 模 . 然而 此 方法 也 有 
几 个 缺点 . 第 一 , 当 上 > 3 时 , 似 然 函 数 安 得 非常 复杂 . 第 二 , 此 方法 在 估计 中 要 求 
带 限制 的 最 大 化 以 保证 De 的 正定 性 . 当 k 很 大 时 , 这 个 限制 将 变 得 很 复杂 . 
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10.3.2 Cholesky 分 解 


x, 的 第 二 个 重新 参数 化 是 利用 Cholesky 分 解 . 参见 第 8 章 的 附录 A. 这 个 方 
法 在 估计 中 有 很 多 优点 , 因为 它 不 会 为 得 到 xu 的 正定 性 加 任何 的 参数 限制 . 参见 
Pourahmadi (1999). 另外 , 这 种 重新 参数 化 方法 是 一 个 止 交 变换 , 所 以 似 然 函数 极 
其 简单 . 下 面 给 出 变换 的 细节 . 

AA D: 是 正定 的 , 所 以 存在 一 个 具有 单位 对 角 元 素 的 下 三 角 和 矩阵 L 和 具有 
正 对 角 元 素 的 对 角 和 矩阵 Ga 满足 


D; = LG, L. (10.12) 


这 就 是 著名 的 X, 的 Cholesky 分 解 . 该 分 解 的 一 个 特征 是 五 , 对 角 线 以 下 的 元 素 与 
G, 的 对 角 元 素 都 有 良好 的 解释 . 我 们 通过 仔细 研究 二 元 和 三 元 的 情形 来 说 明 这 个 
分 解 . 对 二 元 情形 , 我 们 有 


Tu, 021, " we 1 0 Gal} 9 0 
0214 022,4 qun: 1 Ü goat 
Jtr i= 1812.48 gua > 0. 利用 (10.12) 式 , 我 们 有 


» It — 012, gu. 921,t911,t 
t = 二 " 
2 
012,4 022,4 q21,t911,t g22,t + q21 1911.4 


令 上 述 矩 阵 方程 两 边 的 元 素 相 等 , 我 们 得 到 
Tiit = Qté 0214 = Qo1491146 O22, = J22 + Gagie (10.13) 


解 这 个 方程 , 我 们 有 


9214 


gnu,-o0ne qui-— 2 j22,t = 0224 = eni (10.14) 
然而 , 考虑 简单 的 线性 回归 
azt = Part + bot, (10.15) 
其 中 bzt 表示 误差 项 . 由 著名 的 最 小 二 乘 理论 , 我 们 有 
g= Cov(ait, az) _ Tnt 
Var(ar) 0s 
95,4 


Var(b2t) = Var(a2t) — B? Var(ait) = 0224 一 


Fii,t 


进一步 , 误差 项 bor 与 回归 项 au 是 不 相关 的 . 因此 , 利用 (10.14) 式 , 我 们 有 


Jit =i, zue =b, — 9224 = Var(ba), bolar, 
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其 中 | 表示 不 相关 . 总 之 , 2 x 2 矩阵 D, 的 Cholesky 分 解 相当 于 从 a, 到 bi = 
(biz, be)! 进行 的 一 个 正 交 变换 , 满足 


bi; = aye 和 bo, = aoe — q2140315 


其 中 qq, = 8 是 通过 (10.15) SX PE ISTIHR T BIA, Cov(b,) 是 对 角 元 素 为 gue 的 
对 角 阵 . 变换 的 量 gait 与 gue 可 以 作 如 下 解释 : 

(1) Gi 的 第 一 个 对 角 元 素 恰 是 ay, 的 方差 . 

(2) Gt 的 第 二 个 对 角 元 素 是 (10.15) 式 简单 线性 回归 中 残 差 的 方差 . 

(3) 下 三 角 和 矩阵 Li 的 元 素 qoi, 是 (10.15) 式 中 的 回归 系数 2. 

对 高 维 情形 , 以 上 性 质 仍然 成 立 . 例如 , 考虑 三 维 情形 


1 0 0 gii, 0 0 
Ty (qoi,t 1 0 Gi — 0 922,t 0 
dai 932, 1 0 0 gaa,t 


由 (10.12) 式 中 的 分 解 , 我 们 有 


0114; O21,t F314 
O21,t T224 32. 


0314; F732, 0331 


gii q21,t911,t 931,t911,t 
2 
= | qd2149224 921,4911,t + 922,t G31,t921,t911,t + 932,t922,t 
q314911,t 931,921,911, + 932,4922,t G81.4911t + Ge,1922,t + 933,t 


令 上 述 和 矩阵 方程 两 边 的 元 素 相等 , 我 们 有 
人 二 G31 4011 + 9224, O31, = Q31,(911,t: 


2 
732,1 = 931,¢921,t911,t + 932,4922,t, 033 = Q31 (911,6 G32.1922,t + 933.4; 


或 等 价 地 ， 


021,1 2 
girone Ge= emer 922.4 = 022.t — d21,4011,t. 
11,4 


731,4 1 731,021, 
gia m= em (S477 —— Use Bs 
Tiit 922,t F11,t 


= 2 2 
933,14 = 033,4 — %31,2911,t — d32,(922,t- 


这 些 量 看 起 来 很 复杂 , 但 是 它们 只 不 过 是 下 述 正 交 变 换 的 系数 和 残 差 的 方差 


bye =i, bot = Qn Boibit, bat = agt — Paibit — 32021. 
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其 中 5, 是 下 述 最 小 二 乘 回归 的 系数 
azt = Barbie +b, a3t = Baibit 4-332021 + bst- 


换 句 话说 , 我 们 有 qi = Bi,giit = Var(ba) AR iA j. 有 bitLbje 
根据 前 面 的 讨论 , 利用 Cholesky 分 解 相 当 于 作 一 个 从 ar 到 b, 的 正 交 变换 , 其 
P bu = am, A bi(1<i<k) 是 通过 最 小 二 乘 回归 递 推定 义 的 : 


Git = gitbit 十 Gi2,tb2t + --- + qici—1) bi wt | bits (10.16) 
其 中 对 于 1 <i <i, 0:5; 是 下 三 角 矩 阵 工 , 的 第 (ij) 个 元 素 . 
我 们 可 以 将 这 个 变换 写 为 
b, = L;'a,, 或 者 at = Libe, (10.17) 


其 中 , 如 前 所 述 , L 也 是 一 个 上 共有 单位 对 角 元 素 的 下 三 角 阵 . 的 协 方差 矩阵 是 
Cholesky 分 解 中 的 对 角 阵 Gi, 因为 


Cov(b;) = L (Lj!) = Ge. 
在 这 样 一 个 变换 下 , 与 波动 率 建 模 相 关 的 参数 向 量变 为 
E, = (gites ,9gKKt 21,6 031,5 032,65 77 Dl s Oelk) 0), (10.18) 
它 也 是 一 个 k(k-- 1)/2 维 的 向 量 . 
前 面 的 正 交 变换 也 大 大 简化 了 数据 的 似 然 函数 . 利用 | 五 | = 1 的 事实 , 我 们 有 


大 
|E] = |L GL = (Gi) =|] 9a: (10.19) 
i=1 
如 果 在 给 定 过 去 信息 的 条 件 下 at 的 条 件 分 布 是 多 元 正 态 分 布 N (0, 32), 则 变换 后 
的 序列 b, 的 条 件 分 布 是 多 元 正 态 分 布 N(0, G1), 且 数 据 的 对 数 似 然 函 数 变 得 极其 
简单 . 事实 上 , 我 们 有 a, 的 对 数 概率 密度 为 


k 

1 b? 

£(a,. 34) = £(b,., =) = 79 > [into i a " (10.20) 
i1 Uii, 


这 里 为 了 简便 , 忽略 了 常数 项 , A gue 为 ba 的 方差 . 

利用 Cholesky 分 解 , 将 x, 重新 参数 化 有 几 个 优点 . 第 一 , 由 (10.19) 式 , 如 果 
对 所 有 的 i, A giit > 0, WS, 是 正定 的 . 因此 , D: 的 正定 限制 可 以 通过 对 ln(giiy) 
而 不 是 giit 建 模 很 容易 地 得 到 . 第 二 , (10.18) 式 中 参数 向 量 m, 的 元 素 有 良好 的 解 
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FE. 它们 是 使 得 扰动 与 收益 率 正 交 化 的 多 元 线性 回归 的 系数 与 残 差 的 方差 . 第 三 ， 
an 5 au 间 的 相关 系数 为 


021,t q x v/211,t 
p21,t = = 21,t : 
V711,¢F22,4 y/?22,t 


若 qzi FO, W pare 是 时 变 的 . 特别 地 , WR gore = c 7 0, W pare = cmi yoni 

假定 方差 比 0114/0224 不 是 常数 , 则 它 仍然 是 时 变 的 . E r 的 维 数 大 于 2, 时 变性 

也 适用 于 其 他 相关 系数 , 并 且 时 变性 是 将 x, 重新 参数 化 的 两 种 方法 间 的 主要 区 别 . 
利用 (10.16) 式 及 变换 后 的 扰动 bit 之 间 的 正 交 性 , 我 们 有 


í 
2 : b 
Cit = Var(ai,| F1) = > dados; a k, 
v=1 


j 
Tij t = COV (Git; aj Fe) = giantgjuitgooiti j<t, 4=2,;--> ,k, 


v=1 


其 中 对 二 1,… ks quoa = 1. 这些 方 程 给 出 了 如 1; 在 Cholesky 分 解 下 的 参数 化 . 


10.4 二 元 收益 率 的 GARCH 模型 


因为 可 以 用 同样 的 方法 将 许多 一 元 波动 率 模型 推广 到 多 元 情形 , 所 以 我 们 的 讨 
论 集 中 于 多 元 GARCH 模型 . 也 可 以 用 其 他 的 多 元 波动 率 模型 . 

对 一 个 大 维 收 益 率 序列 re, 多 元 GARCH 模型 利用 “精确 方程 ” 来 描述 上 (上 十 
1)/2 维 向 量 m, 随时 间 的 演变 . 精确 方程 的 意思 是 这 个 方程 不 包含 任何 的 随机 扰动 . 
然而 , 精确 方程 即使 是 在 最 简单 的 情形 大 = 2 时 也 可 能 变 得 很 复杂 , 此 时 E, 是 三 
维 的 . 为 了 保持 模型 的 简单 性 , 通常 对 方程 加 一 些 限 制 . 


10.4.1 常 相关 模型 


为 了 使 波动 率 方程 的 个 数 较 少 , Bollerslev (1990) 考虑 了 相关 系数 非 时 变 的 特 
殊 情 形 , Bl pore = por, 其 中 |pai| < 1. 在 此 假定 下 , pi 是 一 个 常 参数 ,从 而 对 
E = (ony. 024) Ma, 波动 率 模型 包含 两 个 参数 . E, 的 GARCH(1,1) 模型 变 为 


Sf = ag-r ona; ,-- B18; 1, (10.21) 


其 中 a? L— (at, 1: 02 4 1)', to 是 一 个 二 维 正 向 量 , H aa 和 B, E 2 x 2 JEMIE 
ne AE. 更 具体 地 , 此 模型 可 以 更 详细 地 表示 为 


2 
One |_| aao | | ou ms 91i: | Bu i2 O11,t—1 
ES A 1 
022.1 (*20 Q21 022 42 11 Boi B22 022,—1 


(10.22) 
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其 中 对 i ==1 和 2, A ay > 0. EX m =a? — E, 我 们 可 将 前 面 的 模型 改写 为 
at = a + (oy + B1)az , +m — Bina 


这 是 关于 a? 过 程 的 一 个 二 元 ARMA(11) 模型 . 这 个 结果 是 第 3 章 中 一 元 
GARCH(1,1) 模型 的 直接 推广 ， 因 此 , 模型 (10.22) 的 一 些 性 质 可 以 从 第 8 章 中 
的 二 元 ARMA(1,1) 模型 的 性 质 中 很 容易 地 得 到 . 特别 地 , 我 们 有 如 下 结果 . 

(1) WR ai + 8, 所 有 的 特征 值 都 是 正 的 , 并 小 于 1, W a2 的 二 元 ARMA(1,1) 
模型 是 弱 平 稳 的 , 从 而 Ela?) 存在 . 这 意味 着 收益 率 的 扰动 过 程 a, 有 正定 的 无 条 
件 协 方差 窍 阵 . at 各 分 量 的 无 条 件 方差 是 (02,03)! = (I — 01 — Bi) s, 且 分 量 
ait 与 azt 间 的 无 条 件 协 方差 是 p210102. 

(2) 如 果 an = Pio = 0, W ar BARA on, 过 去 的 波动 率 . 类 似 地 ， 
WR az = pa = 0, W a», 的 波动 率 不 依赖 于 ul 过 去 的 波动 率 . 

(3) WR o, 和 Bi 是 对 角 的 , 则 此 模型 简化 为 两 个 一 元 GARCH(1,1) 模型 . 此 
时 , 这 两 个 波动 率 过 程 不 再 是 动态 相关 的 . 

(4) 可 以 利用 向 量 ARMA(1,1) 模型 的 预测 方法 类 似 地 得 到 该 模型 的 波动 率 预 
测 . 参见 第 3 章 中 的 一 元 情形 . 以 /为 预测 原点 的 向 前 1 步 波动 率 预测 为 


Ej (1) = ao + 04a; + 6,5}, 
对 向 前 £ 步 预测 , 我 们 有 
Shi 人) 三 ao 十 (al 十 DEC 一 1)，L> 1. 


这 些 预测 是 对 ay 的 边际 波动 率 的 预测 . ai, Fay 之 间 的 向 前 4 步 协 方差 预测 为 
P21 [orn (E022, (£), 其 中 for 是 por 的 估计 , oii.n(4) 是 SEC) 的 分 量 . 

例 10.4 再 次 考虑 例 10.1 中 的 香港 市 场 和 日 本 市 场 的 日 对 数 收益 率 . 利用 二 元 
GARCH 模型 , 我 们 得 到 了 对 数据 拟 合 较 好 的 两 个 模型 . 第 一 个 二 元 模型 的 均值 方 
程 为 


7 二 一 一 0.11871 t-65 +414, Tot = aoe. 
其 中 AR(6) 系数 的 标准 误差 为 0.044. 第 一 个 模型 的 波动 率 方程 为 
0.275 0.112 ， 0.711 
eiit da (0.079) | (0.032) Alai + (0.068) 011,t—1 
022.1 0.051 . 0.091 | [a$, 4 - 0.869 | |o224-1| - 
(0.014) (0.026) (0.028) 


(10.23) 
其 中 小 括号 内 的 数值 为 标准 误差 . ol 与 ay 之 间 的 相关 系数 的 估计 为 0.226, 标准 
误差 为 0.047. 
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4 à, = (G14, üa) 是 标准 化 残 差 , 其 中 ai, = Qit/ VTit. Gt 的 Ljung-Box 统计 
量 为 Qs(4) = 22.29(0.10), Q2(8) = 34.83(0.29), 括号 内 的 数 表 示 p (A. 因为 均值 方 
程 中 利用 了 AR(6) 系数 , 所 以 这 里 的 p 值 分 别 基 于 自由 度 为 15 和 31 的 x? 分 布 ， 
a? 过 程 的 Liung-Box 统计 量 为 Qi(4) = 9.54(0.85), Q3(8) = 18.58(0.96). 因此 , 在 
模型 (10.23) 的 二 元 标准 化 残 差 中 没有 序列 相关 性 或 条 件 异 方差 性 . 香港 市 场 和 日 
本 市 场 的 两 个 残 差 的 无 条 件 新 息 方 差分 别 是 1.55 和 1.28. 

(10.23) 式 的 模型 给 出 了 两 个 分 离 的 波动 率 方 程 , 这 表明 两 个 市 场 的 波动 率 不 
是 动态 相关 的 , 但 它们 是 同步 相关 的 .我 们 将 这 种 模型 称 为 二 元 对 角 常 相关 模型 . 
如 果 忽 略 掉 香 港 市 场 收 益 率 中 很 小 的 延迟 为 6 的 序列 相关 性 , 则 用 S-plus 可 以 很 
容易 地 估计 常 相 关 模 型 

> hkja.ccc=mgarch (rth 1, ccc(1,1), trace=F) 

>summary (hkja.ccc) 


第 二 个 二 元 GARCH 模型 的 均值 方程 为 
ric = —0.143r1 2-6 +414, Tee = Gate, 


其 中 AR(6) 系数 的 标准 误差 为 0.042. 第 二 个 模型 的 波动 率 方程 为 


0.108 ， . 0.865 
ii (0.030) 2 (0.109) 
7^ [— 9.103) |+] - e l reps l 
022.1 0.172 54 1 0.321 0.869 0221-1 


(0.035) (0.135) (0.028) 
(10.24) 
小 括号 内 的 数值 是 标准 误差 . au 与 an 之 间 的 相关 系数 的 估计 为 0.236, 标准 误 
差 为 0.045.， 如 前 一 样 定义 标准 化 的 残 差 . 我 们 得 到 对 于 第 二 个 模型 的 标准 化 残 
差 Qz(4) = 24.22(0.06), Q;(8) = 35.52(0.26); 对 于 标准 化 残 差 的 平方 83(4) = 
17.45(0.29), Q3(8) = 24.55(0.79). 这些 Ljung Box 统计 量 在 5% 水 平 下 都 是 不 显 
著 的 , 从 而 (10.24) 式 中 的 模型 也 是 充分 的 . 第 二 个 模型 中 香港 和 日 本 市 场 新 息 的 
无 条 件 方差 分 别 为 1.71 和 1.32. 
与 模型 (10.23) 比较 , 第 二 个 二 元 GARCH(1,1) 模型 显示 了 两 个 市 场 之 间 的 一 
种 反馈 关系 , 从 而 比较 这 两 个 模型 是 很 有 趣 的 . 第 一 , 模型 (10.24) 的 新 息 的 无 条 件 
方差 接近 于 (10.3) AA (10.4) 式 的 结果 . 第 二 , 图 10-7 给 出 了 模型 (10.23) 所 拟 合 
的 波动 率 过 程 , 而 图 10-8 给 出 了 模型 (10.24) 所 拟 合 的 过 程 . 因为 模型 (10.23) 意 
味 着 两 个 市 场 之 间 的 波动 举 没 有 动态 依赖 性 , 所 以 图 10-7 类 似 于 图 10-2. 相 友 地 ， 
图 10-8 却 给 出 了 两 个 市 场 之 间 相 互 影响 的 证 据 . 第 三 , 模型 (10.23) 的 对 数 似 然 函 
数 最 大 值 为 —535.13, HEP t= 8,--- ,469, 而 模型 (10.24) 的 对 数 似 然 函 数 最 大 值 是 
一 540.32. 参见 (10.11) 式 中 的 对 数 概率 密度 函数 . 因此 , 如 果 用 似 然 原理 , 则 更 喜欢 
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用 模型 (10.23). 最 后 , 因为 两 个 二 元 波动 率 模型 的 实际 含义 有 较 大 不 同 , 为 了 区 分 
它们 需要 做 进一步 的 研究 . 这 样 的 研究 可 能 要 使 用 一 个 更 长 的 样本 时 期 或 包含 更 多 
的 变量 (例如 使 用 一 些 U.S. 市 场 的 收益 率 ). 


(a) 香港 
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200 400 


(b) ak 
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10-7 ————— — bIE. 时 间 区 间 是 从 1996 年 
1 月 1 日 到 1997 年 10 月 16 日 ,收益 率 以 百分比 给 出 的 : (a) 香港 市 场 ; (b) 日 本 
市 场 . 所 用 模型 为 (10.23) 式 
(a) 香港 


5 
4 
1 
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图 10-8 ”香港 和 日 本 股票 市 场 指数 日 对 数 收益 率 的 波动 率 的 估计 值 时 间 区 间 是 从 1996 年 
1 月 1 日 到 1997 年 10 A 16 日 ,收益 率 以 百分比 给 出 的 : (a) 香港 市 场 ; (b) 日 本 
市 场 . 所 用 模型 为 (10.24) 式 


例 10.5 作为 第 二 个 解释 , 考虑 第 8 章 使 用 的 IBM 股票 和 S&P500 指数 月 对 数 
收益 . 时 间 区 间 是 从 1926 年 1 月 至 1999 年 12 A, 且 收 益 率 以 百分比 形式 给 出 . S 
rip 和 ro, 分 别 表示 IBM 股票 和 S&P500 指数 的 月 对 数 收 益 . 如 果 利 用 一 个 常 相关 
的 GARCH(1,1) 模型 , 则 我 们 得 到 的 均值 方程 为 

Tj; = 1.351+ 0.07271 11 十 0.05571 :一 2 一 0.119r2 12 Hait, Ta = 0.703 + 24, 


波动 率 
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第 一 个 方程 中 参数 的 标准 误差 分 别 为 0.225, 0.029, 0.034 和 0.044, 第 二 个 方程 中 参 
数 的 标准 误差 为 0.155. 波动 率 方程 是 


2.98 0.079 . 0.873  —0.031 
ja (0.59) | | (0.018) PL (0.020) (0.009) [e 
022, 2.09 0.042 0.045 | [a2, ,| |—0.066 0.913 | |o224—1]- 
(0.47)| |(0.009) (0.010) (0.015) (0.014) 
(10.25) 


小 括号 内 的 数值 为 标准 误差 . 常 相 关系 数 是 0.614, 标准 误差 为 0.020. 利用 标准 化 
残 差 , 我 们 得 到 Ljung-Box 统计 量 Q2(4) = 16.77(0.21), Q2(8) = 32.40(0.30), 括号 内 
的 了 值 是 分 别 从 自由 度 为 13 和 29 的 x? 分 布 得 到 的 . 这 里 的 自由 度 已 经 调整 了 , 因 
为 均值 方程 包含 三 个 延迟 预测 ， 对 标准 化 残 差 的 平方 , 我 们 有 Q5(4) = 18.00(0.16), 
Q3(8) = 39.09(0.10). 因此 , 在 5% 的 显著 水 平 下 , 标准 化 的 残 差 a, 没有 序列 相关 性 
或 条 件 异 方差 性 . 该 二 元 GARCH(1,1) 模型 表明 这 两 个 月 对 数 收益 的 波动 率 之 间 
具有 反馈 关系 . 


10.4.2 ”时 变相 关 模 型 


常 相 关系 数 波动 率 模 型 的 一 个 主要 缺点 是 : 在 实际 应 用 中 , 相关 系数 有 随时 间 
变化 的 趋势 . 考虑 例 10.5 中 使 用 的 IBM 股票 和 S&P500 指数 的 月 对 数 收益 率 . 我 
们 很 难 有 理由 认为 加 权 平 均 的 S&P500 指数 收益 率 与 在 过 去 70 多 年 的 IBM 收益 
率 保持 一 个 常 相 关系 数 . 图 10-9 利用 120 个 ( 即 10 年 ) 观测 值 的 一 个 滑动 窗口 , 给 
出 了 两 个 月 对 数 收 益 率 序列 之 间 的 样本 相关 系数 . 这 个 相关 性 随时 间 变 化 , 且 看 上 
去 近年 来 正在 递减 . 相关 性 的 递减 趋势 并 不 奇怪 , 因为 IBM 市 场 资本 化 在 较 大 的 
美国 工业 公司 中 的 排名 近年 来 已 经 改变 . Tse (2000) 提出 了 一 个 拉 格 朗 日 乘 子 统计 
量 来 检验 多 元 GARCH 模型 中 常 相关 系数 的 假定 . 


0.8 vx 


1940 1950 1960 1970 1980 1990 2000 


图 10-9 IBM 股票 与 3&P500 指 数 的 月 对 数 收益 率 的 样本 相关 系数 . 这 个 相关 系数 是 由 120 个 
观察 值 的 滑动 窗口 计算 出 来 的 . 样本 时 间 区 间 是 1926 年 1 月 至 1999 年 12 月 
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在 GARCH 框架 内 放松 常 相关 限制 的 一 个 简单 方法 是 对 条 件 相关 系数 指定 一 

个 精确 方程 . 这 可 以 利用 10.3 节 讨 论 的 Ys. 的 两 种 重新 参数 化 方法 , 进而 通过 两 种 

方法 来 进行 . 首先 , 我 们 直接 利用 相关 系数 . 因为 IBM 股票 和 S&P500 指数 收益 率 

间 的 相关 系数 为 正 , 而 且 一 定 在 区 间 [0,1] 中 , 所 以 我 们 用 方程 
exp(qt) 


; 10.26 
1+ exp(qe) ( ) 


pat = 


其 中 


a1, t—102,t—1 

oiit-1 是 扰动 aiti 的 条 件 方差 . 我 们 将 此 方程 称 为 相关 系数 的 一 个 GARCH(1,1) 
模型 , 这 是 因为 它 利 用 了 两 个 扰动 的 1 步 延 迟 交 叉 相 关系 数 与 1 步 延 迟 交叉 乘积 . 
如 果 wi = wa = 0, 则 模型 (10.26) 退化 为 常 相关 的 情形 . 

总 之 , 时 变相 关 的 二 元 GARCH(1,1) 模型 包含 了 两 套 方程 . 第 一 套 方程 包含 了 
条 件 方差 的 一 个 二 元 GARCH(1,1) 模型 . 第 二 套 方程 是 (10.26) 式 中 相关 系数 的 一 
个 GARCH(1,1) 模型 . 实际 中 , 如 果 相 关系 数 为 负 , 则 可 以 在 (10.26) 式 中 添加 一 
个 负 号 . 一 般 来 讲 , 当 相 关 性 的 符号 未 知 时 , 我 们 可 以 利用 相关 系数 的 费 希 尔 变 换 
(Fisher Transformation). 

1+ part exp(qu) — 1 
qi = In (1) 或 Pays 一 eee 

并 对 4 采用 一 个 GARCH 模型 来 对 两 个 收益 率 之 间 的 时 变相 关系 数 建 模 . 
例 10.5( 续 ) ”对 IBM 股票 和 S&P500 指数 的 月 对 数 收 益 率 我 们 建立 了 (10.25) at 
的 GARCH(1,1) 模型 . 将 (10.26) 式 增加 到 其 中 , 并 进行 联合 估计 , 则 对 两 个 序列 我 
们 得 到 下 面 的 模型 : 


Tit = 1.318 + U.076r1 41 — 0.068r» 4.2 十 ait, 
Tot = 0.673 十 tot. 


第 一 个 方程 中 三 个 参数 的 标准 误差 分 别 为 0.215, 0.026 和 0.034, 第 二 个 方程 中 参 
数 的 标准 误差 为 0.151. 波动 率 方程 为 


dt = Wy + Tip, t-11 + We 


2.80 0.084 : 0.864 —0.020 
ie (0.58) | | (0.013) Fa In (0.021) (0.009) pe 
032, 1.71 0.037 — 0.054 | Ja, , —0.058 0.914 | |o224-1]| - 
(0.40)| |(0.009) (0.010) (0.014) (0.013) 
(10.27) 
如 前 , 小 括号 内 的 数值 为 标准 误差 . 条 件 相 关系 数 方程 为 
ape DOE. de = —2.024 + 3.983p,..1 +. Se (10.28) 
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估计 的 标准 误差 分 别 为 0.050, 0.090 和 0.019. 上 述 相关 系数 方程 的 参数 是 高 度 显 
SE Ag. 对 标准 化 残 差 去 应 用 Ljung-Box 统计 量 , 有 Qa(4) = 20.57(0.11), Q2(8) = 
36.08(0.21). 对 残 差 序列 的 平方 , 有 Q3(4) = 16.69(0.27), Q3(8) = 36.71(0.19). 因此 ， 
模型 的 标准 化 残 差 没有 显著 的 序列 相关 性 或 条 件 异 方差 性 . 

将 这 个 时 变相 关系 数 的 GARCH(1,1) 模型 与 (10.25) 式 中 的 常 相 关系 数 的 
GARCH(1,1) 模型 进行 比较 很 有 趣 . 第 一 , 两 个 模型 的 均值 方程 和 波动 率 方程 都 接 
近 . 第 二 , 图 10-10 给 出 了 基于 模型 (10.28) 对 IBM 股票 和 S&P500 指数 的 月 对 数 收 
益 率 所 拟 合 的 条 件 相关 系数 的 时 间 图 . 此 图 表明 该 相关 系数 随时 间 波 动 , 而 且 近 几 
年 变 得 更 小 . 后 一 个 特征 与 图 10-9 的 结论 一 致 . 第 三 , 对 相关 系数 拟 合 的 平均 值 为 
0.612, 这 与 (10.25) 式 中 常 相关 模型 的 估计 0.614 基本 相同 , 第 四 , 利用 ri 的 样本 方 
差 作为 条 件 方差 的 初始 值 . 观测 值 从 + 三 4 到 t+= 888. 则 对 常 相关 GARCH(1,1) 模 
型 , 其 对 数 似 然 函数 的 最 大 值 为 -3 691.21; 对 时 变相 关 GARCH(1,1) 模型 , 其 对 数 
似 然 函 数 的 最 大 值 为 -3 679.64. 这 表明 , 与 常 相 关 模 型 相 比 时 变相 关 模 型 的 确 有 一 
些 显著 的 改善 . 第 五 , 考虑 两 个 模型 以 h = 888 为 预测 原点 的 向 前 1 步 波 动 率 预 测 . 
对 (10.25) 式 的 常 相关 模型 , 我 们 有 aisse = 3.075, a2,888 = 4.931, o11,888 = 77.91, 
ooa ass = 21.19. 因此 , 对 条 件 协 方差 矩阵 的 向 前 1 步 预测 为 


71.09 21.83 
x = $ 
sas (1) | 21.83 17.79 | 


其 中 协 方差 是 通过 常 相 关系 数 0.614 得 到 的 . 对 于 (10.27) 式 和 (10.28) 式 的 时 变 
相关 模型 , 我 们 有 asss = 3.287，az ssg = 4.950, oi1,888 = 83.35, 022,888 = 28.56, 
psss = 0.546. 协 方差 矩阵 的 向 前 1 步 预测 为 


75.15 23.48 
Sasa(1) = 
888(1) | 23.48 24.70 | 


其 中 相关 系数 的 预测 为 0.545. 


1940 1960 1980 2000 


年 
图 10-10 X IBM 股票 与 S&P500 指数 月 对 数 收益 率 的 条 件 相 关系 数 拟 合 例 10.5 中 时 变相 
关系 数 GARCH(1,1) 模型 时 的 时 间 图 . 水 平 线 是 相关 系数 的 平均 值 0.612 
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在 第 二 个 方法 中 . 我 们 利用 D 的 Cholesky 分 解 来 对 时 变相 关 性 建 模 . 对 二 元 
情形 , 参数 向量 为 B, = (gue 9224,02). 参见 (10.18) 式 . 假定 a, 服从 下 述 简单 
GARCH(1,1) 类 模型 


giit = Qin + anbi ea + 5191.1: 
q21,t = Yo + ¥1921,t-1 十 了 202,t 一 1， (10.29) 


Ja2,t = O29 + O21 BF 41 + 02203 4, + Bargire—1 + G22922,t-1; 


其 中 , bu = ait, bu = aa 一 qi tau 这 样 , 假定 bi 为 一 个 一 元 GARCH(1,1) 模型 ， 
ba, 使 用 一 个 二 元 GARCH(1,1) 模型 , qu: 是 自 相 关 的 , 并 将 a2, à 作为 一 个 额外 
的 解释 变量 . 与 MLE 相关 的 概率 密度 函数 由 (10.20) 式 给 出 , 取 k= 2. 

例 10.5( 续 ) ”我 们 再 次 使 用 IBM 股票 和 S&P500 指数 的 月 对 数 收益 率 来 说 
8j (10.29) 式 的 波动 率 模型 ， 利 用 与 前 面 同样 的 指定 , 我 们 得 到 拟 合 的 均值 方程 
为 


rye = 1.364 + 0.07574, 1 — 0.058r2, 9 + aie, Tae = 0.643 + aze- 


其 中 , 第 一 个 方程 中 参数 的 标准 误差 分 别 为 0.219, 0.027 和 0.032, 第 二 个 方程 中 参 
数 的 标准 误差 为 0.154. 这 两 个 均值 方程 都 接近 于 以 前 得 到 的 结果 . 拟 合 的 波动 率 
模型 为 


grie = 3.714+ 0.11351 , 4 + 0.804g11,—1; 
q21,: = 0.002 9 + 0.991 5214-1 — 0.004 lassi, (10.30) 


922,1 = 1.023 + 0.02151 ,.. + 0.05205 , , — 0.040g11,—1 + 0.937922,11. 


HP bi = aye, bu = az 一 qa ebu. 方程 gua 中 参数 的 标准 误差 分 别 为 1.033, 0.022 
和 0.037. 方程 qae 中 参数 的 标准 误差 分 别 为 0.001, 0.002 和 0.000 4, 方程 go». 
中 参数 的 标准 误差 分 别 为 0.344, 0.007, 0.013 和 0.015. 所 有 的 估计 都 在 1%% 水 平 下 
显著 . 

条 件 协 方差 矩阵 x, 可 以 利用 (10.12) 式 中 的 Cholesky 分 解 从 模型 (10.30) 中 
得 到 . 对 二 维 情 形 , 这 个 关系 在 (10.13) 式 中 已 经 详细 给 出 . 因此 , RAPIST eA 
关系 数 为 

dy _ a _ (10.31) 
VIL, ¢F22,t v 922,t + d91811,t 
利用 cii 和 ooo. 的 拟 合 值 , 我 们 可 以 计算 标准 化 残 差 来 进行 模型 检验 .模型 
(10.30) 的 标准 化 残 差 的 Ljung-Box 统计 量 为 Q2(4)=19.77(0.14), Q2(8)=34.22(0.27). 
对 标准 化 残 差 的 平方 , 我 们 有 Q3(4) = 15.34(0.36), Q5(8) = 31.87(0.37). 这 样 , 所 拟 
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合 的 模型 在 描述 条 件 均值 和 波动 率 方 面 是 充分 的 ， 这 个 模型 反映 了 该 相关 性 有 很 
强 的 动态 依赖 . 这 可 从 (10.30) 式 的 系数 0.991 5 看 出 . 

图 10-11 给 出 了 (10.31) 式 拟 合 的 时 变相 关系 数 . 它 给 出 了 比 图 10-10 更 光滑 
的 相关 模式 , 并 确认 了 相关 系数 的 递减 趋势 . 特别 地 , 所 拟 合 的 最 近 几 年 的 相关 系 
数 要 小 于 其 他 模型 的 拟 合 值 . 对 BM 股票 和 S&P500 指数 的 月 对 数 收益 率 的 两 个 
时 变相 关 模 型 具有 相当 的 最 大 似 然 函数 值 , 大 约 为 -3 672, 这 表明 拟 合 是 相似 的 . 
然而 , 基于 Cholesky 分 解 的 方法 可 能 有 一 些 优点 . 首先 ， 它 并 不 要 求 为 了 保证 X, 
的 正定 性 而 在 估计 中 做 任何 参数 限制 . 如 果 也 利用 了 gae 的 对 数 变换 , 则 对 整个 的 
波动 率 模型 都 不 需要 限制 . 其 次 , 在 变换 下 , 对 数 似 然 函数 变 得 很 简单 . 最 后 , 时 变 
参数 gij: 和 gua 有 良好 的 解释 . 然而 , 该 变换 使 得 推断 有 点 复杂 ， 因为 拟 合 的 模型 
可 能 依赖 于 a, 中 元 素 的 次 序 . 请 记 住 , an 没有 变换 . 理论 上 , a 中 元 素 的 次 序 应 
该 不 会 对 波动 率 产 生 影响 ， 
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图 10-11 用 带 Cholesky 分 解 的 时 变相 关系 数 GARCH(1,1) 模型 拟 合 的 IBM 股票 与 
S&P500 指数 的 月 对 数 收 益 率 的 条 件 相关 系数 . 水 平 线 是 相关 系数 的 平均 值 
0.612 


最 后 , 对 于 新 的 时 变相 关 模 型 , 以 + 一 888 为 预测 原点 , 条 件 协 方差 矩阵 的 向 前 
1 步 预 测 为 


73.45 7.34 
Esss(1) = | 7.34 17.87 | i 
由 此 得 到 的 相关 系数 的 预测 为 0.203. 该 值 远 远 小 于 前 两 个 模型 给 出 的 结果 . 然而 ， 


条 件 方 差 的 预测 与 前 面 类 似 . 
10.4.3 ”最 近 的 一 些 发 展 


对 于 p,, 利用 (10.7) 式 中 的 参数 化 , 有 些 作者 提议 利用 参数 个 数 更 为 节约 的 模 
型 来 描述 时 变 的 相关 系数 . 下 面 讨论 在 该 方面 的 两 个 发 展 . 
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对 于 人 维 收益 率 , Tse 和 Tsui (2002) 假定 条 件 相关 矩阵 p, 服从 模型 
Pi = (1— 0i — 02) p + 061p, ., + 829, ,, 


其 中 0, 和 0; 是 尺度 参数 , p 是 具有 单位 对 角 元 素 的 kxk 正定 矩阵 , AL Pii 是 
k x k 样本 相关 和 矩阵, 它 是 利用 时 间 点 + 一 m,… ,t 一 1 上 的 扰动 计算 的 , 其 中 m 是 
事先 指定 的 . 要 求 对 两 个 尺度 参数 0, 03 的 佑 计 作 特 浆 的 限制 以 保证 相关 和 矩阵 
的 正定 性 . 这 是 一 个 参数 非常 节约 的 模型 , 然而 该 模 卉 在 实际 中 很 难 应 用 . p Alm 
的 选择 需要 进行 仔细 的 研究 . 

Engle(2002) 提出 了 如 下 模型 : 


Pi = J4QyV,, 
其 中 , Q, = (qijt)kxk 是 正定 矩阵 ,Jr = diazi l,- 0:7), 且 Q, 满足 
Q, = (1— 4; — 02)Q + 016, 416, 4 + Qiii; 


上 式 中 e, 是 标准 化 的 新 息 向 量 , 其 第 ; 个 分 量 为 <v = ait/V5at H. Q 是 et 的 无 
条 件 协 方差 矩阵 , 01 和 0 是 满足 0< 0, | 02 <1 的 非 负 刻度 参数 . .7 是 用 来 标准 
化 的 矩阵 以 保证 Re 是 相关 和 矩阵 . 

上 述 两 个 模型 有 一 个 明显 的 缺陷 , 即 9, 和 02 是 刻度 , 因此 所 有 的 条 件 相 关系 
数 具 有 相同 的 动态 性 . 在 实际 应 用 中 , 很 难 去 判断 这 是 否 合理 , 尤其 是 当 维 数 k 较 
大 时 . 
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在 本 节 中 , 利用 Cholesky 分 解 的 序 贯 性 , 我 们 提出 一 个 构造 更 高 维 波动 率 模型 
的 策略 . 再 次 将 向 量 收益 序列 写 为 re = p, + ay. 可 以 利用 第 8 章 的 方法 为 r 指定 
一 个 均值 方程 . 通常 简单 的 向 量 AR 模型 就 足够 了 . 这 里 我 们 集中 讨论 利用 扰动 过 
FE a, 建立 波动 率 模型 . 

根据 10.3 节 对 Cholesky 分 解 的 讨论 , 从 a; 到 bi, 的 正 交 变换 只 涉及 了 bii(j < 
i). HIN, gie 的 模型 只 依赖 于 与 bi < i) 相关 的 量 . 从 这 种 意义 上 讲 10.4 节 建 
立 的 时 变 波动 率 模型 是 嵌 套 的 . 因此 , 我 们 考虑 按照 下 面 的 一 系列 程序 来 建立 多 元 
波动 率 模型 . 

(1) 选择 一 个 最 感 兴趣 的 市 场 指数 或 股票 收益 率 . 对 选择 的 收益 率 序列 建立 一 
个 一 元 波动 率 模型 . 

(2) 将 第 二 个 收益 率 序列 扩充 到 系统 中 , 将 扩充 后 的 新 收益 率 序列 的 扰动 过 程 
进行 正 交 变换 , 并 对 系统 建立 一 个 二 元 波动 率 模型 . 第 1 步 中 一 元 模型 的 参数 估计 
可 以 作为 二 维 估计 的 初始 值 
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(3) 将 第 三 个 收益 率 序列 扩充 到 系统 中 , 对 新 增加 的 扰动 过 程 进行 正 交 变换 , 并 
建立 一 个 三 元 波动 率 模型 . 二 元 模型 的 参数 估计 作为 三 维 估计 的 初始 值 . 

(4) 继续 此 扩充 直到 对 所 有 感 兴趣 的 收益 率 序 列 建立 了 联合 波动 率 模型 

最 后 , 在 每 一 步 中 进行 模型 检验 以 保证 所 拟 合 模型 的 充分 性 . 经 验 表明 这 一 系 
列 程序 可 以 实质 性 地 简化 建立 高 维 波动 率 模型 的 复杂 性 , 特别 是 可 以 大 大 减少 估计 
的 计算 时 间 . 
fil 10.6 ”我们 通过 对 S&P500 指数 、Cisco 系统 股票 和 Intel 公司 股票 的 日 对 数 
收益 率 建立 一 个 波动 率 模型 来 说 明 上 面 所 提出 的 一 系列 程序 . 数据 的 时 间 区 间 是 从 
1991 年 1 月 2 日 至 1999 年 12 月 31 H, 共 2 275 个 观测 值 . 对 数 收益 率 以 百 分 
比 表 示 . 图 10-12 给 出 了 其 时 间 图 . 收益 率 序列 的 分 量 排序 为 m. = (SP54 CSCO+， 
INTC,)'. 数据 的 样本 均值 、 样 本 标准 差 和 样本 相关 矩阵 为 


0.066 91 0.875 1.00 0.52 0.50 
ñ= | 0.257 |, j =| 2:853 |, P= | 052 1.00 04 
0.156 963 2.464 0.50 0.47 1.00 
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图 10-12 S&P500 指数 ((a)). Cisco 系统 股票 ((b)) 和 Intel 公司 的 股票 ((c)) 的 日 对 数 收 
益 率 (百分比 形式 ) 的 时 间 图 , 时 间 区 间 是 从 1991 年 1 月 2 日 到 1999 年 12 月 31 日 


利用 Ljung-Box 统计 量 来 识别 收益 率 序 列 之 间 的 序列 相关 性 , 得 到 Q@3(1) = 
26.20, Qa(4) = 79.73, Qa(8) = 123.68. 这 些 检 验 统计 量 都 是 高 度 显著 的 ， 分 别 与 自 
由 度 为 9, 36 和 72 的 xz 分 布 比较 , 其 p 值 都 接近 于 0. 数据 中 确实 存在 某 些 序列 相 
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ATE. 表 10-1 给 出 了 以 第 8 章 中 的 简单 记号 表示 的 样本 交叉 相关 矩阵 的 前 5 个 延 
ÀR. 检查 此 表 可 见 (a) S&P500 指数 的 日 对 数 收益 率 并 不 依赖 于 Cisco 或 Intel 过 去 
的 收益 率 ; (b) Cisco 股票 的 对 数 收益 率 具 有 某 些 序列 相关 性 ,并且 依赖 于 S&P500 
指数 的 过 去 收益 率 ( 见 延 迟 2 和 5); (c) Intel 股票 的 对 数 收益 率 依赖 于 S&P500 指 
数 的 过 去 收益 率 (IMAR 1 和 5). 这 些 观 测 类 似 于 第 8 章 中 分 析 的 IBM 股票 和 
S&P500 指数 收益 率 之 间 的 结果 . 它们 表明 具有 较 大 资本 的 单个 公司 的 收益 率 倾向 
于 受 市 场 过 去 行为 的 影响 . NAT, 市 场 收 益 率 并 不 会 受到 单个 公司 过 去 收益 率 的 显 
著 影 响 . 


表 10-1 S&P500 指数 、Cisco 系统 股票 和 Intel 公司 的 股票 的 日 对 数 收 益 率 的 样本 交叉 相 
ASEH. 时 间 区 间 是 从 1991 年 1 月 2 日 到 1999 年 12 月 31 日 
间 隔 


进而 考虑 波动 率 模型 、 按 照 所 建议 的 步骤 , 我 们 从 S&P500 指数 的 对 数 收益 率 
开始 , 得 到 模型 


r= 0.078+-0.042r, t—1—0.062r, ,人 3 一 0.048r1 + 414 一 0.0521; ¢ 5--a1,, 
711.4 =0.013 + 0.092a7 , , + 0.894011 4.1, 


均值 方程 中 参数 的 标准 误差 分 别 为 0.016, 0.023, 0.020, 0.022 和 0.020; 波动 率 方 程 
中 参数 的 标准 误差 分 别 为 0.002, 0.006 和 0.007. 一 元 模型 的 标准 化 残 差 及 标准 化 
残 差 平方 序列 的 Ljung-Box 统计 量 没 有 识别 出 数据 中 任何 余 留 的 序列 相关 性 或 条 
件 异 方差 性 . 事实 上 , 对 标准 化 残 差 , 我 们 有 Q(10) = 7.38(0.69), 而 对 其 平方 序列 ， 
Q(10) = 3.14(0.98). 

将 Cisco 股票 的 日 对 数 收益 率 扩充 到 系统 中 ， 我 们 建立 一 个 二 元 模型 , 具有 的 
均值 方程 为 


(10.32) 


T14 =0.065 一 0.046r1 4.3 + aye, 
T2¢ = 0.325 + 0.1957; t-23 一 0.091 r2 4—9 T 054. 
其 中 所 有 的 估计 在 1% 的 水 平 下 都 是 统计 显著 的 . 利用 Cholesky 分 解 的 记号 , 我 们 
得 到 波动 率 方程 为 
gi1,t = 0.006 + 0.05167, 1 十 0.9439il 4-1, 
q21,t = 0.331 + 0.790q21.11 = 0.041ag +- 1s (10.34) 
922,t = 0.177 + 0.08263 ，1 + 0.89092» 4-1. 


其 中 bu = art, bat 一 am 一 gl bys. gu 方程 中 参数 的 标准 误差 分 别 为 0.001,0.005 
和 0.006; qai,e 方程 中 参数 的 标准 误差 分 别 为 0.156,0.099 和 0.011: oae 方程 中 参数 


(10.33) 
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的 标准 误差 分 别 为 0.029, 0.008 和 0.011. 标准 化 残 差 的 二 元 Ljung-Box 统计 量 没 有 
识别 出 任何 余 留 的 序列 相关 性 与 条 件 异 方差 性 , 从 而 二 元 模型 是 充分 的 . 与 (10.32) 
式 比较 , 我 们 看 出 rit 的 边际 模型 和 一 元 模型 之 间 的 差别 很 小 . 
下 一 步 (也 是 最 后 - 步 ) 是 将 Intel 股票 的 日 对 数 收益 率 扩充 到 系统 中 . 均值 
方程 变 为 
riz 0.065 — 0.0431; 43 Hart; 
r2, = 0.326 + 0.201r4,,.2 一 0.08972,t 一 2 + a2: (10.35) 
rat = 0.192 — 0.264r, 4,1 + 0.059r3 2-1 + ast. 


第 一 个 方程 中 参数 的 标准 误差 分 别 为 0.016 和 0.017; 第 二 个 方程 中 参数 的 标准 误 
差分 别 为 0.052.0.059 和 0.021; 第 三 个 方程 中 参数 的 标准 误差 分 别 为 0.050, 0.057 
和 0.022. KA 1% 的 水 平 下 所 有 的 估计 在 都 是 统计 显著 的 . 如 所 料想 , ru 和 rat 的 
均值 方程 与 二 维 情形 中 的 基本 相同 . 

三 维 时 变 波动 率 模型 变 得 更 加 复杂 , 但 仍然 很 容易 处 理 , 因为 


gii,t = 0.006 + 0.05001 1_1 + 0.943g911,2-1, 
q21,t = 0.277 + 0.82421 4-1 — 0.035a2,4-1, 
922.1 = 0.178 + 0.08265 ,_1 + 0.889922,t-1, 
qai. = 0.039 + 0.973q31,41—1 + 0.01003,1—1. 
432,1 = 0.006 + 0.981q32,,—1 + 0.004a2 4-1, 
933,t = 1.188 + 0.05353 ,.., + 0.687 933,e-1 — 0-019922,t-1, 


(10.36) 


其 中 bit = Ait, bz2t — a2; 一 qoi ibis; ba, = aa, 一 qai coii s3 g32,tb2t. K 10-2 给 出 了 参 
数 的 标准 误差 . 除了 aso. 方程 中 的 常数 项 , 所 有 的 估计 在 5% 的 水 平 下 都 是 显著 的 . 
令 à, — (art /Fit, @2t/F2t, 026 / Fst)" 为 标准 化 的 残 差 序列 , 其 中 ou = Vous 是 对 第 
i 个 收益 率 拟 合 的 条 件 标准 差 . a, 的 Ljung Box 统计 量 给 出 Q3(4) = 34.48(0.31), 
Qa(8) = 60.42(0.70), 其 中 x? 分 布 的 自由 度 分 别 为 31 和 67, 该 自由 度 是 将 均值 方 
程 中 使 用 的 参数 数量 调整 之 后 得 到 的 ， 对 于 残 差 序列 的 平方 af, 我 们 有 @3(4) = 
28.71(0.58), Q3(8) = 52.00(0.91), 因此 , 在 给 条 件 均值 和 波动 率 建 模 时 所 拟 合 的 模 
型 是 充分 的 . 


X 10-2 给 S&P500 指数 ，Cisco 系统 股票 和 Intel 公司 股票 的 日 对 数 收益 率 (百分比 形 
s) 拟 合 的 三 元 波动 率 模型 的 参数 a 估计 值 的 标准 差 ， 时 间 区 间 是 从 1991 年 1 
月 2 日 到 1999 年 12 A 31H * 


标准 差 
0.001 0.005 0,006 好 21 
0.029 0.009 0.011 
0.407 0.015 0.100 0.008 | 932: 


a 参数 出 现 的 顺序 与 (10.36) 式 中 的 顺序 一 样 . 


0.135 0.086 0.010 
0.017 0.012 0.004 
0.001 


x 
uw 
= 
- 
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方程 (10.36) 中 的 三 元 波动 率 模 型 有 一 些 有 趣 的 特征 . 第 一 , 它 本 质 上 是 一 个 
时 变相 关 的 GARCH(1,1) 模型 , 因为 方程 中 只 用 到 了 1 PIREA. 第 二 , S&P500 
指数 日 对 数 收益 率 的 波动 率 不 依赖 于 Cisco 或 Intel 股票 收益 率 过 去 的 波动 率 . 第 
=, 通过 取 Cholesky 分 解 的 道 变换 ,Cisco 和 Intel 股票 日 对 数 收益 率 的 波动 率 依 
赖 于 市 场 收益 率 过 去 的 波动 率 . 参见 10.3 节 给 出 的 Xu, Dy 和 G 的 元 素 之 间 的 关 
系 . 第 四 , 描述 相关 的 量 gj 有 很 高 的 持续 性 , 并 具有 很 大 的 AR(1) 系数 . 

图 10-13 给 出 了 数据 拟 合 模型 的 波动 率 过 程 ( 即 5;; ,). 指数 收益 率 的 波动 率 远 
远 小 于 两 个 单 只 股票 收益 率 的 波动 率 . 图 形 也 表明 了 指数 收益 率 的 波动 率 近年 来 已 
经 增加 , 但 是 Cisco 系统 股票 的 收益 率 却 并 非 如 此 ， 图 10-14 给 出 了 三 种 收益 率 序 
列 之 间 的 时 变相 关系 数 . 比较 图 10-13 与 图 10-14 可 得 到 有 意思 的 结论 . 这 些 结论 
表明 当 收 益 率 波动 时 , 两 个 收益 溉 序列 之 间 的 相关 系数 是 递增 的 . 这 与 国际 股票 市 
场 指数 间 关 系 的 实证 研究 结果 是 一 致 的 , 两 个 市 场 之 间 的 相关 性 在 金融 危机 期 间 倾 
向 于 递增 . 

(a) 


波动 率 


1992 1994 1996 1998 2000 


1992 1994 1996 1998 2000 


1992 1994 1996 1998 2000 


图 10-13 ”给 从 1991 年 1 月 2 日 到 1999 年 12 月 31 H: (a) S&P500 指数 ; (b) Cisco 系统 和 ; 
(c) Intel 公司 的 股票 的 日 对 数 收 益 率 (百分比 形式 ) 拟 合 的 波动 率 的 时 间 图 


(10.36) 式 中 的 波动 率 模型 包含 两 套 方程 . 第 一 套 方程 描述 了 条 件 方差 的 时 间 
演变 (BI git), 第 二 套 方程 处 理 相 关系 数 ( 即 aie, i > 7). WOM RRR REE 
合 , 一 个 AR(1) 模型 对 相关 系数 方程 可 能 就 足够 了 ， 类 似 地 , 一 个 简单 的 AR BE 
型 对 条 件 方差 也 可 能 是 足够 的 . 定义 v, = (Virt, U22,4, V334)! ,其 中 v, = ln(gii t), 
qi = (421,5 431,5 93214). 前面 的 讨论 启示 我 们 可 以 利用 简单 的 1 步 延 迟 模型 
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ve = Ci Biti, de= C2 + B5q,..1 


作为 对 资产 收益 率 波动 率 建 模 的 精确 函数 , 其 中 ci 是 常 向 量 , 9, 是 3 x 3 KAE 
阵 . 如 果 前 一 方程 中 再 加 上 噪声 项 , 则 模型 变 为 
V = C1 + iVi- + ei gd 三 cz 十 Do29g 1 十 e2b 
其 中 e, 是 均值 为 0 的 随机 扰动 , 具有 正定 协 方差 矩阵 , 并 且 我 们 有 一 个 简单 的 多 
元 随机 波动 率 模型 . 在 一 个 最 近 的 手稿 中 , Chib, Nardari 和 Shephard(1999) 利用 
MCMC 方法 来 研究 高 维 的 随机 波动 率 模型 . 那里 考虑 的 模型 以 一 种 带 限 制 的 方式 
允许 时 变 的 相关 性 . 多 元 波动 率 模型 的 其 他 参考 文献 包括 Harvey, Ruiz 和 Shephard 
(1995). 在 第 12 章 中 , 我 们 将 讨论 波动 率 建 模 的 MCMC 方法 . 
(a) S&P 500 指数 与 Cisco 系 统 
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图 10-14 ”给 S&P500 指数 、Cisco 系统 股票 和 Intel 公司 股票 的 日 对 数 收益 率 拟 合 的 时 变相 
关系 数 的 时 间 图 , 时 间 区 间 是 从 1991 Æ 1 A 2 AB 1999 46 12 H 31 H 
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简化 多 元 波动 率 过 程 动态 结构 的 另 一 种 方法 是 利用 因子 模型 . 实际 中 ,“ 公 共 
因子 ”可 以 通过 固有 性 质 或 经 验方 法 预先 设 定 . 作为 说 明 , 我 们 利用 第 8 章 的 因子 
分 析 来 讨论 因子 波动 率 模型 . 因为 波动 举 模 型 关心 的 是 at 的 条 件 方差 矩阵 随时 间 
的 演变 , 其 中 a, = ri — nu, 所 以 波动 率 中 识别 “公共 因子 ”的 一 个 简单 方式 是 对 as 
进行 主 成 分 分 析 (PCA). 具体 可 参见 第 8 章 中 的 PCA. 这 样 , 建立 一 个 因子 波动 率 
模型 涉及 一 个 三 步 的 程序 : 
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。 选 择 前 几 个 主 成 分 , 使 得 它们 所 能 解释 的 a 的 变化 占 很 高 的 百分比 ; 

e 对 选择 的 主 成 分 建立 一 个 波动 率 模 型 ; 

。 将 每 个 ai 序列 的 波动 率 与 所 选 主 成 分 的 波动 率 联系 起 来 . 
这 个 程序 的 目的 是 降低 维 数 , 但 要 保持 多 元 波动 率 较 精 确 的 近似 . 
例 10.7 ”再 次 考虑 例 10.5 中 的 IBM 股票 和 S&P500 指数 以 百分比 表示 的 月 对 数 
收益 率 . 利用 例 8.4 中 的 二 元 AR(3) 模型 , 我 们 得 到 新 息 序列 a 根据 a, 的 协 方差 
矩阵 对 a, 进行 主 成 分 分 析 , 我 们 得 到 特征 值 63.373 和 13.489. 第 一 个 特征 值 解释 了 
a, 的 广义 方差 的 82.2%. 因此 , 我 们 可 以 选择 第 一 个 主 成 分 m, = 0.79701, + 0.604azt 
作为 公共 因子 . 另外 一 种 选择 , 正如 例 8.4 中 的 模型 表明 的 , ", 的 序列 相关 性 很 弱 . 
从 而 可 以 直接 对 v, 进行 主 成 分 分 析 . 对 这 个 特例 , re 的 样本 协 方差 和 矩阵 的 两 个 特 
征 值 是 63.625 和 13.513, 这 与 基于 a, 的 结果 基本 相同 , 第 个 主 成 分 近似 解释 了 
rt 的 广义 方差 的 82.5%, 对 应 的 公共 因子 是 m, = 0.796ri, + 0.605ro,.. 因此, 对 所 考 
虑 的 两 个 月 对 数 收益 率 序列 , 条 件 均值 方程 对 PCA 的 影响 是 可 以 忽略 的 . 

根据 前 面 的 讨论 , 并 且 为 了 简便 , 对 这 两 个 月 对 数 收益 兴 序 列 , 我 们 使 用 x, = 
0.796rt + 0.605ra, 作为 一 个 公共 因子 . 图 10-15a 给 出 了 这 个 公共 因子 的 时 间 图 . 
如 果 使 用 一 元 高 斯 GARCH 模型 , 则 对 z, 我 们 得 到 下 面 的 模型 : 


Ti = 1:317 十 0.0962:,_4 十 Qt, Gt = OfEt， 
c? — 3.834 + 0.11022 , + 0.82502 ,. 


此 模型 的 所 有 参数 估计 在 1% 的 水 平 下 都 是 高 度 显著 的 , 而 且 标准 化 的 残 差 及 其 平 
方 序列 的 Ljung-Box 统计 量 没有 识别 出 模型 的 不 充分 性 . 图 10-15b 给 出 了 xm 的 
拟 合 波动 率 (BI. (10.37) 式 中 的 样本 o? 序列 ). 


(10.37) 


(a) 第 一 主 成 分 


1960 1980 
(b) 氢 合 的 波动 率 过 程 

400 
9* 300 
R 
3 200 

100 
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图 10-15 (a) IBM 股票 和 S&P500 指数 的 月 对 数 收 益 率 的 第 一 主 成 分 的 时 间 图 ; (b) 基于 
GARCH(1, 1) 模型 所 拟 合 的 波动 率 过 程 
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利用 模型 (10.37) 中 的 o? 作为 一 个 共同 波动 率 因子 , 对 于 原始 的 月 对 数 收益 
率 , 我 们 得 到 下 面 的 模型 . 均值 方程 为 
rig = 1.140 + 0.0797; a + 0.067r1,42 — 0.192r2 4. 2 + ai, 
rac = 0.537 + are. 
第 一 个 方程 中 参数 的 标准 误差 分 别 是 0.211, 0.030, 0.031 和 0.043 , 第 二 个 方程 中 参 
数 的 标准 误差 是 0.165. 条 件 方差 方程 为 


19.08 0.098 - 0.333 

P 2 
eus || | (3-70) Se (0.044) Gea | (0.076) a?, (10.38) 
0224 —5.62 ， 62.4 0.596 

(2.36) (0.050) 


如 前 一 样 , 小 括号 内 的 数值 是 标准 差 , o2 是 从 模型 (10.37). 得 到 的 , 条 件 相关 系数 
方程 为 
a Ste ge = —2.098 + 4.120p.—1 + CaS 
三 个 参数 的 标准 误差 分 别 是 0.025, 0.038 和 0.015. 如 前 一 样 定义 标准 化 的 残 差 序 
列 , 得 到 Qo(4) = 15.37(0.29), Qo(8) = 34.24(0.23), 其 中 , 小 括号 内 的 数值 表示 p 
(&. 因此 , 标准 化 的 残 差 没有 序列 相关 性 . 对 其 平方 序列 , 有 Q5(4) = 20.25(0.09), 
Q5(8) = 61.95(0.000 4). 这 说 明 (10.38) 式 的 波动 率 模 型 不 能 充分 处 理 数 据 的 条 件 
异 方差 性 , 尤其 是 在 更 高 延迟 时 . 这 并 不 奇怪 , 因为 单个 公共 因子 仅仅 解释 了 数据 
广义 方差 的 大 约 82.5%. 

比较 (10.38) 式 和 (10.39) 式 中 的 因子 模型 与 (10.27) AA (10.28) 式 中 的 时 变 
相关 模型 , 我 们 看 出 (a) 两 个 模型 的 相关 方程 基本 相同 ; (b) 如 所 料想 , 在 波动 率 方 
程 中 , 因子 模型 利用 了 较 少 的 参数 ; (c) 公共 因子 模型 提供 了 数据 波动 率 过 程 的 一 
个 合理 的 近似 . 

注释 : — 4] 10.7 中 , 我 们 利用 了 一 个 两 步 估 计 程 序 . 第 一 步 中 , 对 公共 因子 建 
立 了 一 个 波动 率 模 型 第 二 步 中 把 波动 率 的 估计 当 作 已 给 定 来 估计 多 元 波动 率 模 
型 ， 这 样 的 估计 程序 很 简单 , 但 可 能 并 不 有 效 . 更 加 有 效 的 估计 程序 是 进行 联合 
估计 . 这 种 操作 在 公共 因子 已 知 的 条 件 下 相对 比较 容易 ， 例 如 , 对 例 10.7 中 的 月 
对 数 收 益 率 , 如 果 认 为 公共 因子 x, = 0.769r,, + 0.60579, 是 给 定 的 , 则 可 以 对 方程 
(10.7) — (10.39) 进行 联合 估计 . o 


pi (10.39) 


10.7 应 用 


我 们 通过 考虑 多 种 资产 的 一 个 金融 头寸 的 VaR 来 说 明 多 元 波动 率 模型 的 应 用 . 
假定 投资 者 持 有 价值 为 100 万 美元 的 Cisco 系统 股票 和 Intel 公司 股票 的 一 个 长 期 
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头寸 . 我 们 利用 两 只 股票 从 1991 年 1 H 2 A 1999 年 12 H 31 日 的 日 对 数 收 益 
率 建立 波动 率 横 型 . 在 数据 期 间 的 最 后 , 利用 向 前 1 步 预测 和 5% 的 临界 值 来 计算 
VaR. 

4 VaR, 表示 持 有 Cisco 系统 股票 头寸 的 VaR, 并 令 VaR。s 表示 持 有 Intel 股 
票 头寸 的 VaR. 第 7 章 中 的 结果 证 明了 投资 者 总 的 日 VaR 为 


VaR = V VaR? + VaR? + 2pVaR; VaRa. 


在 这 个 解释 中 , 我 们 考虑 计算 VaR 的 波动 率 模型 的 三 种 方法 . 为 了 简便 , 我 们 没有 
对 涉及 的 参数 或 模型 检验 统计 量 报告 其 标准 误差 . 所 有 的 参数 估计 在 5% 的 水 平 下 
都 是 统计 显著 的 , 而 且 根 据 标准 化 的 残 差 序列 及 其 平方 序列 的 Ljung-Box 统计 量 可 
知 该 模型 是 充分 的 . 对 数 收益 以 百分比 表示 , 以 致 VaR 计算 中 的 分 位 数 除了 100. 
令 ru 表示 Cisco 系统 股票 的 收益 率 , ray 表示 Intel 股票 的 收益 率 . 
一 元 模型 
此 方法 对 每 只 股票 收益 率 都 使 用 一 元 波动 率 模型 , 并 用 股票 收益 率 的 样本 相关 
系数 估计 p. 两 只 股票 收益 率 的 一 元 波动 率 模型 为 
rit =0.380 | 0.034r1.s—1 — 0.061r1,t-2 — 0.055r1 13 + art, 
77, — 0.599 + 0.117af p1 + 0.81407»), 
rat = 0.187 + age, 
73, — 0.310 + 0.03243 ,_, + 0.91803 ，1. 


样本 相关 系数 为 0.473. VaR 计算 中 需要 以 + = 2 275 为 预测 原点 的 向 前 1 步 预测 
为 
ĉi = 0.626, 67=4.152, #=0.187, 62 =6.087, J= 0.473. 


两 个 日 收益 率 的 5% 分 位 数 为 
qı = 0.626 一 1.65V4.152 = —2.736, q2 = 0.187 — 1.65V6.087 = —3.884. 
其 中 负 号 表示 损失 . 单 只 股票 的 VaR 为 
VaR, = $1 000 000g; /100 = $27 360, VaRə = $1 000 000g2/100 = $38 840. 
因此 , 投资 者 总 的 VaR 为 VaR = $57 117. 
常 相关 二 元 模型 
此 方法 对 股票 收益 率 采用 一 个 二 元 GARCH(1,1) 模型 . 假定 相关 系数 随时 间 
固定 不 变 , 但 它 可 以 与 其 他 参数 联合 估计 . 模型 为 


Tit = 0.385 + 0.038r1 1.1 = 0.0601; 4—2 — 0.04771 4.3 + ait, 
rot — 0.222 + azt, 
011,4 — 0.624 +0.110a? ，; 2- 0.816011,4.1, 
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722, — 0.664 + 0.03843 ,_; + 0.853020.1-1, 

p=0.475. 
这 是 一 个 对 角 的 二 元 GARCH(1,1) BUS. VaR 计算 中 在 预测 点 t+ 一 2 275 的 1 步 向 
前 预测 为 


fi = 0.373, 01 =4.287, f2=— 0.222, 82 — 5.706, p=0.475. 


因此 , 我 们 有 
VaR, = $30 432, VaRs = $37 195. 


投资 者 总 的 5% 的 VaR 为 VaR = $58 180. 
时 变相 关 模 型 
最 后 , 通过 Cholesky 分 解 我 们 允许 相关 系数 随时 间 变 化 , 拟 合 的 模型 为 


ri, — 0.355 + 0.03971 41 — 0.05771, 4-2 — 0.038r1 43 + are, 
r2, — 0.206 + az, 

gi1.t = 0.420 + 0.09152 ,_1 + 0.858g11,4—1, 

qoit — 0.123 + 0.689921 4.1 — 0.014a2,,. 1, 

922,t = 0.080 + 0.01352 ,.., 十 0.971922 .4.1, 


其 中 bie = it; bo, = an — qau- VaR 计算 所 需 的 在 预测 点 + = 2 275 处 的 1 步 
向 前 预测 为 


f,—0.352, 790.206, 41 4.252, go, =0.421, Gon = 5.594. 


因此 , 我 们 有 62 = 4.252, 621 = 1.791, 62 = 6.348. 相关 系数 为 5 = 0.345. 利用 这 些 
预测 , 我 们 有 VaR, — $30 504, VaR, — $39 512. 总 风险 值 VaR = $57 648. 

三 个 方法 的 VaR 估计 是 类 似 的 . 一 元 模型 给 出 了 最 低 的 VaR, 而 常 相关 模型 
产生 了 最 高 的 VaR. 差别 大 约 为 1100 美元 . 时 变 波动 率 模型 是 两 个 极端 模型 的 中 
fi. 


10.8 ZT t 分 布 


实证 分 析 表 明 , 前 一 节 中 使 用 的 多 元 高 斯 新 息 可 能 不 能 刻画 资产 收益 率 的 峰 
HE. 华 这 种 情形 下 , 多 元 学 生 t- 分 布 可 能 是 有 用 的 . 存在 许多 形式 的 多 元 学 生 t- 
分 布 . 这 里 对 波动 率 的 建 模 , 我 们 给 出 一 个 简单 的 形式 ， 

ER k 维 随机 向 量 m = (zi1,… zk) 服从 自由 度 为 v、 参 数 为 u= 0, 允 = 了 7( 单 
位 矩阵 ) 的 多 元 学 生 t— 分 布 , 如 果 其 概率 密度 函数 (pdf) 为 


Helv) — Lt /DY 


一 —(v--k)/2 
“Gamera a i ya (10.40) 
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其 中 工 (y) 是 伽 马 函数 . 参见 Mardia, Kent 和 Bibby (1979, p57). (10.40) 式 的 每 个 
分 量 x; 的 方差 为 v/(v — 2). 从 而 定义 = J/(v — 2)/va XA HEK v 的 标准 化 的 
多 元 学 生 t— 分 布 . 通过 变换 , e, 的 概率 分 布 密度 函数 是 

T'((v.1 k)/2) 
[x(v — 2)]*/2r(v/2) 
对 波动 率 模型 , 记 a, = X1 ^e, 并 假定 e, 服从 (10.40) 式 中 的 多 元 学 生 t- 分 布 . 
通过 变换 , a 的 概率 密度 函数 是 

F((v + k)/2) 

in(v — 2) 2r (v/2) mp2 + (79 
而 且 , 如 果 我 们 利用 X, 的 Cholesky 分 解 , 则 变换 后 的 扰动 b, 的 概率 分 布 密度 函 
数 变 为 


flet) = [1 Y CEE aa e/e,]-(** 9/4. (10.41) 


f(arlv, 34) = 71g/$:71g,]-(e**/2. 


T k) /9 k p2 —({uv+k)/2 
E E id. i 1+(v—2)7! Eac | | 
[n(v > 2)]*/2T(v/2) IHi- Jjj,t j=l Qint 


其 中 a, = Libi, gjjt 是 bi 的 条 件 方差 . 因为 这 个 概率 密度 函数 并 不 包含 任何 矩阵 
的 逆 , 所 以 很 容易 计算 数据 的 条 件 似 然 函 数 . 


附录 — 对 估计 的 一 些 注释 


本 章 中 多 元 ARMA 模型 的 估计 是 利用 “科学 计算 帮手 ”中 的 时 间 序 列 程序 
SCA 进行 的 . 多 元 波动 率 模型 的 估计 可 以 利用 S-plus 中 的 FinMetrics 或 时 间 序 列 
的 回归 分 析 (RATS) 程序 进行 . 下 面 是 利用 RATS 程序 估计 多 元 波动 率 模型 的 一 
些 运 行 流程 . LL *" 开始 的 行 表示 “注解 ". 


例 10.5 中 的 对 角 常 相关 AR(2)-GARCII(1,1) 模型 的 估计 


该 程序 包括 对 每 一 个 分 量 的 一 些 Ljung-Box 统计 量 以 及 最 后 几 个 观测 的 一 些 
拟 合 值 . 数据 文件 为 mn-ibmspln.dat, 有 两 列 共 888 个 观测 . 


all 0 888:1 

open data m-ibmspin.txt 

data(org-obs) / r1 r2 

set hl = 0.0 

set h2 - 0.0 

nonlin a0 al bl a00 all bil rho cl c2 pi 

frml alt = rl(t)-cl-pl*r2(t-1) 

frml a2t - r2(t)-c2 

Erml gvarl = a0+al*alt (t-1) **2+b1*h1 (t-1) 

frml gvar2 = a00+all*a2t (t-1) **24+b11*h2 (t-1) 

frml gdet = -0.5*(log(hl(t)-gvarl(t))«log(h2(t)-gvar2(t)) $ 
*log(1.0-rho**2)) 
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frml gln = gdet(t)-0.5/(1.0-rho**2)*((alt(t)**2/h1(t)) $ 
+(a2t (t)**2/h2 (t))-2*rho*alt (t)*a2t (t) /sqrt (hi (t) *h2(t)) 

smpl 3 888 

compute c1 = 1.22, c2 = 0.57, pi = 0.1, rho = 0.1 

compute a0 = 3.27, al = 0.1, bl = 0.6 

compute a00 = 1.17, all = 0.13, bil = 0.8 

maximize (method=bhhh, recursive,iterations=150) gln 

set fvl = gvarl(t) 

set resil = alt(t)/sqgrt(fv1i(t)) 

set residsq = resil(t)*resil(t) 

* Checking standardized residuals * 

cor(qstats,number=12,span=4) resil 

* Checking squared standardized residuals * 

cor (qstats,number=12,span=4) residsq 

set fv2 = gvar2(t) 

set resi2 = a2t(t)/sqrt(fv2(t)) 

set residsq = resi2(t) *resi2(t) 

* Checking standardized residuals * 

cor (qstats,number=12,span=4) resiz 

* Checking squared standardized residuals * 

cor (qstats,number=12,span=4) residsq 

* Last few observations needed for computing forecasts * 

set shock1 = alt (t) 

set shock2 = a2t(t) 

print 885 888 Shockl shock2 fvl fv2 


例 10.5 中 的 时 变相 关系 数 模型 的 估计 


all 0 888:1 
open data m-ibmspin.txt 
data(org=obs) / r1 r2 
set hl 45.0 
set h2 31.0 
set rho - 0.8 
nonlin a0 al bl f1 a00 all b11 dil f11 cl c2 pl p3 q0 qi q2 
frml ait = rl(t)-cl-pi*rl(t-1)-p3*r2(t-2) 
frml a2t - r2(t)-c2 
frml gvarl = a0«al*alt(t-1)**24b1*hl(t-1)4f1*h2(t-1) 
frml gvar2 a00+all*a2t (t-1) **2+b11*h2 (t-1)+f£11*hi(t-1) $ 
+dll*ait(t-1)**2 
frm] rhi = G0 + qi*rho(t-1) $ 
+ q2*alt (t-1) *a2t (t-1) /sqrt (hl (t-1) *h2(t-1)) 
frml rh = exp(rh1(t))/(1«exp(rh1(t))) 
frml gdet - -0.5*(log(h1(t)-gvari(t))«log(h2(t)-gvar2(t)) $ 
*log(1.0- (rho(t)srh(t))**2)) 
frml gln = gdet(t)-0.5/(1.0-rho(t)**2)*((alt(t)**2/h1(t)) $ 
+(a2t (t) **2/h2 (t) ) -2*rho(t) *alt (t) *a2t (t) /sqrt (h1(t)*h2(t))) 
smpl 4 888 
compute cl = 1.4, c2 = 0.7, pl = 0.1, p3 = -0.1 


= 
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compute a0 = 2.95, al = 0.08, bl = 0.87, f1 = -.03 
compute a00 = 2.05, all = 0.05 
compute bil = 0.92, f11=-.06, d1i1=.04, qO = -2.0 


compute ql = 3.0, q2 = 0.1 
nlpar(criterion-value,cvcrit-0.00001) 
maximize (method=bhhh, recursive, iterations=150) gin 
set fvl = gvari (t) 

set resil = alt(t)/sqrt(fv1(t)) 

set residsq = resil(t)*resil(t) 

* Checking standardized residuals * 

cor (qstats,number=16,span=4) resil 

* Checking squared standardized residuals * 
cor (qstats,number=16,span=4) residsq 

set fv2 = gvar2(t) 

set resi2 = a2t(t)/sqrt(fv2(t)) 

set residsq = resi2(t)*resi2(t) 

* Checking standardized residuals * 

cor (qstats,number=16,span=4) resi2 

* Checking squared standardized residuals * 
cor (qstats,number=16,span=4) residsq 

* Last few observations needed for computing forecasts * 
set rhohat = rho(t) 

set shock1 = alt (t) 

set shock2 = a2t(t) 

print 885 888 shockl shock2 fv1 fv2 rhohat 


利用 Cholesky 分 解 进行 例 10.5 中 的 时 变相 关系 数 模型 的 估计 


all 0 888:1 

open data m-ibmspln.txt 

data(org-obs) / r1 r2 

set hl = 45.0 

set h2 20.0 

set q - 0.8 

nonlin a0 al bl a00 all b11 dll fll cl c2 Di pi ‘20 tl t2 

frml alt = rl1(t)-c1-pi*r1(t-1)-p3*r2(t-2) 

frml a2t - r2(t)-c2 

frml vl = a0«al*alt(t-1)**2«b1*h1(t-1) 

frml qti = tO + tl*q(t-1) + t2*a2t(t-1) 

frml bt = a2t(t) - (q(t)=qt(t))*ait(t) 

frml v2 = a00«all*bt(t-1)**2«b11*h2(t-1)«fil*hl(t-1) $ 
*dill*alt (t-1)**2 


frml gdet = -0.5*(log(hi(t) = vi(t))* log(h2(t)-v2(t))) 
frml garchln = gdet-0.5* (ait (t) **2/h1 (t) +bt (t) **2/h2(t) ) 
smpl 5 888 

compute cl - 1.4, c2 - 0.7, pl - 0.1, p3 - -0.1 


compute a0 = 1.0, al = 0.08, b1 = 0.87 
compute a00 = 2.0, ail = 0.05, b11 = 0.8 
compute  d11-.04, f11=-.06, tO -0.2, tl 


M 
e 
H 
S 
li 
o 
Hd 
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nlpar(criterion-value,cvcrit-0.00001) 
maximize (method=bhhh, recursive,iterations=150) garchin 


set 
set 


Evi. = 
resil 


vi (t) 
= alt(t)/sqrt(fv1(t)) 


set residsq = resil(t)*resil(t) 

* Checking standardized residuals * 

cor (qstats,number=16,span=4) resil 

* Checking squared standardized residuals * 
cor (qstats,number=16,span=4) residsq 

set fv2 = v2(t)+qt(t)**2*v1(t) 


set 


resi2 


= a2t(t)/sqrt(fv2(t)) 


set residsq = resi2(t)*resi2(t) 

* Checking standardized residuals * 

cor (qstats,number=16,span=4) resi2 

* Checking squared standardized residuals * 
cor (qstats,number=16,span=4) residsq 

* Last few 


observations needed for forecasts * 


set rhohat = qt(t)*sqrt(v1(t) /fv2(t)) 

set shockl = alt(t) 

set shock2 = a2t(t) 

set g22 = v2(t) 

set q21 = qt(t) 

set b2t = bt (t) 

print 885 888 shockl shock2 fvl fv2 rhohat g22 q21 b2t 


利用 Cholesky 分 解 进行 例 10.6 中 的 三 元 时 变相 关系 数 波动 率 模 型 的 估计 
初始 的 估计 值 是 由 序 贯 建 模 方法 给 出 . 


all 0 2275:1 
open data d-cscointc.txt 
data(org=obs) / r1 r2-r3 


set 
set 
set 
set 
set 
set 


BY je 1. 
h2 = 4. 
h3 = 3. 
gq21 = 
q31 = 
q32 = 


nonlin cl 


frml 
frml 
frmi 
frml 
frml 
frml 
frml 


alt = 
a2t 
a3t = 


ooo 
Ww w C 


0 
0 
0 


C2 C3 p3 p21 p22 p31 p33 a0 al a2 tO ti t2 b0 bi $ 
uO ul u2 wo wl w2 dO d1 d2 ds 

rl(t)-cl-p3*r1(t-3) 
r2(t)-c2-p21*r1(t-2)-p22*r2(t-2) 

r3 (t)-c3-p31*r1(t-1)-p33*r3(t-1) 


vl = aO+al*alt (t-1)**24+a2*h1 (t-1) 


qit = 


tO + ti*q21(t-1) + t2*a2t(t-1) 


bt = a2t(t) - (q21(t)=qit(t))*alt(t) 
v2 = bO+b1*bt (t-1) **2+b2*h2 (t-1) 
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frml q2t u0 + ul*q31(t-1) + u2*a3t (t-1) 
frml q3t = WO + wi*q32(t-1) + w2*a2t (t-1) 
frml bit a3t(t)-(q31(t)-q2t(t))*ait(t)-(q32(t)-q3t (t) ) *bt (t) 
frml v3 = d0+d1*bit (t-1) **2+d2*h3 (t-1) «d5*h2 (t-1) 
frml gdet = -0.5*(log(hl(t) = vi(t))4 log(h2(t)=v2(t)) $ 
+log (h3 (t) =v3(t))) 
frml garchln = gdet-0.5* (alt (t) **2/h1 (t)+bt(t)**2/h2(t) $ 
+b1t (t) **2/h3 (t) ) 
smpl 8 2275 


compute cl = 0.07, c2 = 0.33, c3 = 0.19, pl = 0.1, p3 = -0.04 
compute p21 =0.2, p22 = -0.1, p31 = -0.26, p33 = 0.06 
compute a0 = .01, al = 0.05, a2 = 0.94 

compute t0 = 0.28, tl -0.82, t2 = -0.035 

compute bo = .17, bl = 0.08, b2 = 0.89 

compute u0- 0.04, ul - 0.97, u2 - 0.01 

compute w0 =0.006, w1-0.98, w2=0.004 


compute dO =1.38, dl = 0.06, d2 0.64, d5 - -0.027 
nlpar(criterion-value,cvcrit-0.00001) 
maximize (method=bhhh, recursive, iterations=250) garchln 
set fvl = vl1(t) 
set resil = alt(t)/sqgrt(fv1(t)) 
set residsq = resil(t)*resil(t) 
* Checking standardized residuals * 
cor (qstats,number=12,span=4) resil 
* Checking squared standardized residuals * 
cor (qstats,number=12,span-4) residsq 
set fv2 = v2(t)+qlt(t) **2*v1(t) 
set resi2 = a2t(t)/sqrt(fv2(t)) 
set residsq = resi2(t)*resi2(t) 
* Checking standardized residuals * 
cor (qstats,number=12,span=4) resi2 
* Checking squared standardized residuals * 
cor (qstats,number=12,span=4) residsq 
set fv3 = v3 (t) +G2FE (t) **2*v1 (t) +q3t (t) **2*v2 (t) 
set resi3 = a3t(t)/sqrt(fv3(t)) 
set residsq - resi3(t)*resi3(t) 
* Checking standardized residuals * 
cor (qstats,number=12,span=4) resi3 
* Checking squared standardized residuals * 
cor (qstats,number=12,span=4) residsq 
* print standardized residuals and correlation-coefficients 
set rho21 = qit(t)*sqrt (v1 (t) /fv2(t)) 
set rho31 q2t (t) *sqrt (v1 (t) /fv3(t) ) 
set rho32 = (q2t(t)*qit(t)*vi(t) $ 
*q3t (t) *v2(t)) /sqrt (fv2(t) *£v3(t)) 
print 10 2275 resil resi2 resi3 
print 10 2275 rho21 rho31 rho32 
print 10 2275 fv1 fv2 fv3 
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10.1 


10.2 


10.3 


10.4 


10.5 


10.6 


10.7 


10.8 


10.9 


练 习 题 


考虑 S&P 综合 指数 .IBM 股票 和 Hewlett-Packard(HPQ) 股票 从 1926 年 1 月 至 2003 年 
12 月 的 月 对 数 收益 率 , 共 504 个 观测 值 . 对 数 收 益 率 数据 在 文件 n-spibmhpq6203.txt 中 . 
对 于 这 三 个 对 数 收 益 率 序列 , 利用 指数 加 权 滑 动 平均 方法 获得 多 元 波动 率 序列 ,和 的 估计 
值 是 多 少 ? 画 出 这 三 个 波动 率 序 列 的 时 间 图 . 

讨论 IBM 股票 和 HPQ 股票 从 1926 年 1 月 至 2003 年 12 月 的 月 对 数 收益 率 . 为 这 个 二 
元 收益 率 序列 拟 合 一 个 DVEC(1, 1) 模型 . 该 模型 是 否 充分 ? 画 出 所 拟 合 的 波动 率 序列 和 
时 变相 关系 数 的 时 间 图 . 

讨论 S&P 综合 指数 和 HPQ 股票 的 月 对 数 收益 率 , 为 这 个 二 元 序列 建立 一 个 BEKK f& 
78. 所 氛 合 的 模型 是 什么 ? 画 出 所 拟 合 的 波动 率 序列 和 时 变相 关系 数 的 时 间 图 . 

为 S&P 综合 指数 、IBM 股票 和 HPQ 股票 3 个 月 对 数 收益 率 建立 一 个 常 相关 波动 率 模 
型 . 给 出 所 拟 合 的 模型 , 该 模型 是 否 充 分 ? 为 什么 ? 

文件 m-spibmge ,txt 包含 了 S&P500 指数 、IBM 股票 、 通 用 电气 股票 从 1926 年 1 月 至 
1999 年 12 月 的 月 对 数 收益 率 , 收益 率 包括 了 分 红 并 以 百分比 表示 ,讨论 通用 电气 股票 和 
S&P500 指数 以 百分比 表示 的 月 对 数 收 益 率 . 对 这 个 二 元 序列 建立 一 个 常 相关 GARCH 模 
型 . 检验 拟 合 模型 的 充分 性 , 并 得 到 协 方差 矩阵 以 1999 年 12 月 为 预测 原点 的 向 前 1 步 预 
a. 
讨论 以 百分比 表示 的 GE 股票 和 S&P500 指数 的 月 对 数 收 益 率 . 并 对 这 个 二 元 序列 建立 
一 个 时 变相 关 的 GARCH WAN, 并 对 相关 系数 利用 logistic 函数 . 检验 拟 合 模型 的 充分 性 ， 
并 得 到 协 方差 矩阵 以 1999 年 12 月 为 预测 原点 的 向 前 1 步 预测 

讨论 以 百分比 表示 的 通用 电气 股票 和 S& P500 指数 的 月 对 数 收 益 率 , 对 这 个 二 元 序列 利用 
Cholesky 分 解 建立 一 个 时 变相 关 的 GARCH 模型 . 检验 拟 合 模型 的 充分 性 , 并 得 到 协 方 
差 窍 阵 以 1999 年 12 月 为 预测 原点 的 向 前 1 步 预测 ， 比 较 所 得 模型 与 前 面 两 个 问题 中 所 
得 的 模型 . 

考虑 三 维 收益 率 序列 . 利用 Cholesky 分 解 给 数据 建立 多 元 时 变相 关 波 动 率 模型 . 讨论 模 
型 的 涵义 , 并 计算 预测 原点 为 + = 888 的 向 前 1 步 波 动 率 预测 值 . 

一 位 投资 者 想 知道 他 持 有 50 万 美元 的 Dell 股票 和 100 万 美元 Cisco Systems 股票 的 多 
头头 寸 的 风险 值 (VaR). 用 从 1990 年 1 月 20 日 到 1999 年 12 月 31 日 的 日 对 数 收益 率 
和 5% 的 临界 值 来 计算 . 数据 在 文件 d-dellcsco9099 .txt, 运用 10.7 节 介 绍 的 波动 率 建 模 
的 三 种 方法 , 并 对 结果 进行 比较 . 
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状态 空间 模型 为 时 间 序 列 分 析 提 供 了 一 种 灵活 的 方法 , 尤其 是 在 简化 最 大 似 然 
估计 和 处 理 缺 失 值 方面 . 本 章 将 讨论 状态 空间 模型 和 ARIMA 模型 的 关系 、 卡尔 曼 
滤波 算法 、 各 种 平滑 方法 及 一 些 应 用 . 在 引进 一 般 的 状态 空间 模型 之 前 , 我 们 先 介 
绍 一 个 简单 模型 . 该 模型 体现 了 状态 空间 方法 应 用 于 时 间 序 列 分 析 的 基本 思想 . 为 
了 对 这 个 简单 模型 作 进 一 步 说 明 , 我 们 用 该 模型 来 分 析 某 公司 资产 收益 率 的 已 实现 
波动 率 序 列 、 时 变 系数 的 市 场 模型 以 及 每 只 股票 的 季度 收益 序列 . 

许多 书 都 讨论 了 如 何 利用 状态 空间 模型 进行 统计 分 析 . Durbin and Koopman 
(2001) 给 出 了 状态 空间 模型 最 近 的 一 些 处 理 方法 ; Kim and Nelson (1999) 则 集中 
讨论 了 状态 空间 模型 在 经 济 和 体制 转换 中 的 应 用 ; Anderson and Moore (1979) 对 
于 状态 空间 模型 方法 的 理论 和 应 用 给 出 了 很 好 的 概括 (主要 是 工程 和 最 优 控制 方 
面 ). 许多 时 间 序 列 的 教科 书 都 包含 了 状态 空间 模型 和 卡尔 曼 滤 波 方 面 的 内 容 ,， 例 
w, Chan (2002), Shumway and Stoffer (2000), Hamilton (1994) 和 Harvey (1993) 中 
都 有 章节 讨论 该 问题 . West and Harrison (1997) 给 出 了 一 种 贝 叶 斯 处 理 方 法 , 其 重 
点 在 于 预测 . 而 Kitagawa and Gersch (1996) 则 使 用 了 一 种 壮 消 的 先 验 方法 . 

卡尔 曼 滤波 和 平滑 算法 的 推导 必然 要 用 到 大 量 的 符号 . 因此 , 若 读者 只 对 状态 
空间 模型 的 概念 和 应 用 感 兴趣 , 那么 相对 来 说 11.4 节 将 比较 枯燥 , 故 初次 阅读 时 可 
以 跳 过 不 读 . 


11.1 局 部 趋势 模型 
考虑 一 元 时 间 序 列 ye, 满足 
Ye =H + et et~ N(0,02), (11.1) 


Jui = heth, m ~ N(0,02), (11.2) 
其 中 e, 和 mm EARR ARAE SJEA, t = 1,… T. 初始 值 p 或 者 给 定 , 或 者 服从 一 
个 已 知 的 分 布 , AAS e, Aly, 独立 (t > 0). 这 里 jw 是 第 2 章 中 的 随机 游 走 , 初始 
值 为 ja; ye 是 pe 的 观测 版 本 , 只 多 了 噪声 e. 在 文献 中 , ju 称 为 序列 的 趋势 , 并 不 
能 直接 观测 到 , 而 y, 是 观测 数据 , 其 观测 噪声 为 e 由 于 et 是 序列 不 相关 的 , 故 ye 
的 动态 依赖 性 由 jw 的 动态 依赖 性 所 决定 . 
利用 (11.1) RA (11.2) 式 的 模型 可 以 很 容易 地 分 析 某 项 资产 价格 的 已 实现 波 
动 率 , 可 参见 下 面 的 例 11.1. 这 里 uu 代表 资产 价格 潜在 的 对 数 波动 率 , y 是 已 实现 
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波动 率 的 对 数 . 真正 的 对 数 波动 率 并 不 能 被 直接 观测 到 , 但 它 可 根据 随机 游 动 模型 
而 随时 间 演 变 . 另 一 方面 , v, 由 高 频 交 易 数 据 构 建 , 从 而 受到 市 场 微观 结构 影响 的 
约束 . e, 的 标准 差 代表 刻度 , 用 来 衡量 市 场 微观 结构 的 影响 . 

(11.1) 式 和 (11.2) 式 的 模型 是 一 个 特殊 的 线性 高 斯 状态 空间 模型 (linear Gaus- 
sian state-space model). 变量 u 代表 系 统 在 + 时 刻 的 状态 且 不 能 被 直接 观测 
到 . (11.1) 式 给 出 了 数据 y, 和 状态 Mu 的 联系 , 称 为 测量 误差 为 et 的 观测 方 
程 (observation equation with the measurement error et). (11.2) 式 决 定 了 状态 变 
量 随 时 间 的 演变 方式 , 称 为 新 息 为 m 的 状态 方程 (或 状态 转移 方程 ), Durbin and 
Koopman(2001) 也 称 该 模型 为 局 部 水 平 模型 (local level model)， 另 外 ， 该 模型 是 
Harvey(1993) 中 结构 时 间 序 列 模 型 (structural time series model) 的 一 种 简单 情形 . 


与 ARIMA 模型 的 关系 
如 果 (11.1) 式 中 没有 测量 误差 , 即 ce = 0, W y = pu. 此 时 模型 变 为 ARIMA 
(0, 1, 0) 模型 , 若 ce > 0, 即 存在 测量 误差 , W y, 为 满足 下 式 的 ARIMA(0,1,1) 模型 
(1— B)y = (1 — 0 B)at, (11.3) 


其 中 {a4} 是 均值 为 零 方差 为 o2 的 高 斯 白 噪声 . 9 和 02 (ffi o, 和 om 决定 . 下 
面 给 出 了 该 结果 的 推导 . 
由 (11.2) 式 , 我 们 有 


(1— B) =m 或 pea = DES 
利用 该 结果 可 以 将 (11.1) 式 改写 为 
yt = 1 i pta T 8t: 


上 式 两 端 同时 乘 以 (1 — B), 我 们 得 到 
(1 = B)y = Th—1 + & —6—1. 


今 (1 = B)y = We, 可 以 得 到 Ww, = Th-1 FEet— eti. 在 前 面 的 假定 lh, 很 容易 看 出 
(a) wy 服从 高 斯 分 布 ; (b) Var(u,) = 202 + 82; (c) Cov(tty tt_i) = —e2; (d) j » 1 
时 , 有 Cov(we, wej) = 0. 因此 w 服从 MA (1) 模型 , 可 以 写成 ww = (1 — 0B)a,. 
通过 让 w, = (1—0B)a, = m1 十 et — ea 的 方差 和 延迟 为 1 的 协 方差 相等 , 可 以 
得 到 
(1+@?)of =202+02, G02 =o?. 

对 于 给 定 的 o2 和 o2, 考虑 上 述 两 式 的 比值 便 可 以 得 到 一 个 关于 9 的 二 次 函数 . 该 
二 次 方程 有 两 个 解 , 我 们 必须 选择 满足 |9| < 1 的 那个 解 . o? 可 以 很 容易 得 到 于 
是 , (11.1) 式 和 (11.2) 式 的 状态 空间 模型 也 是 ARIMA(0,1,1) 模型 . 它 是 第 2 章 中 
的 简单 指数 平滑 模型 . 
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另 一 方面 , 对 于 0 AIER ARIMA(0,1,1) 模型 , 可 以 利用 上 述 两 个 等 式 解 出 o? 
和 o2, 并 且 得 到 一 个 局 部 趋势 模型 . 如 果 OAK, 模型 可 以 写成 不 带 观测 误差 (B 
c. = 0) 的 状态 空间 的 形式 .事实 上 , 我 们 以 后 将 会 看 到 ，ARIMA 模型 可 以 通过 
多 种 方法 变换 为 状态 空间 模型 . 因此 , 线性 状态 空间 模型 与 ARIMA 模型 是 密切 相 
关 的 . 

在 实际 中 , 人 们 只 能 观测 到 序列 y,. 因此 , 若 只 是 基于 数据 , 则 是 利用 ARIMA 
模型 进行 决策 还 是 利用 线性 状态 空间 模型 进行 决策 并 不 关键 . 两 个 模型 都 有 优 缺 
点 , 在 选择 统计 模型 时 , 数据 分 析 的 目的 , 本 质问 题 和 经 验 都 起 到 了 很 重要 的 作用 ， 
例 11.1 为 了 说 明 状 态 空 间 模 型 和 卡尔 曼 滤 波 的 思想 , 我 们 考虑 Alcoa 股票 一 天 
内 的 已 实现 波动 率 . 时 间 区 间 是 从 2003 年 1 月 2 日 到 2004 年 5 月 7 日 , 共 340 个 
观测 . 所 用 的 日 己 实 现 波 动 率 是 一 天 内 每 隔 10 分 钟 的 对 数 收益 率 的 平方 和 , 其 中 
对 数 收益 率 以 百分比 形式 给 出 . 计算 中 没有 用 隔夜 的 收益 率 , 即 不 用 当天 内 的 第 一 
个 10 分 钟 的 收益 率 . 关于 已 实现 波动 率 的 更 多 信息 可 参见 第 3 章 . 演示 中 所 用 的 
序列 是 日 已 实现 波动 率 的 对 数 . 

图 11-1 给 出 了 Alcoa 股票 已 实现 波动 率 对 数 的 时 间 图 , 时 间 区 间 是 从 2003 
年 1 月 2 日 到 2004 年 5 月 7 日 . 交易 数据 来 自 NYSE 的 TAQ 数据 库 . GRA 
ARIMA 模型 , 我 们 得 到 下 述 ARIMA(0,1,1) 模型 


(1— B)y =(1—0.855B)aq,, 6 = 0.5184, (11.4) 


其 中 y 已 实现 波动 率 的 对 数 , 6 的 标准 误差 是 0.029. 残 差 序列 给 出 Q(12) = 12.4, 
p 值 是 0.33, 这 表明 残 差 中 没有 显著 的 序列 相关 性 . 类 似 地 , 残 差 序列 的 平方 给 出 
Q(12) = 8.2, p 值 是 0.77, 这 表明 序列 没有 ARCH 效应 . 


0 100 200 300 
天 


图 11-1 Alcoa 股票 一 天 内 的 已 实现 波动 率 对 数 的 时 间 图 , 时 间 区 间 是 从 2003 年 1 月 2 日 
到 2004 年 5 H 7 日. 已 实现 波动 率 用 一 天 内 每 阳 10 分 钟 的 对 数 收益 率 计算 , 其 
中 对 数 收益 率 以 百分比 形式 给 出 
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由 于 6 是 正 的 , 我 们 可 以 将 ARIMA(0,1,1) 模型 转换 为 (11.1) 式 和 (11.2) 式 的 
局 部 趋势 模型 . 两 个 参数 的 最 大 似 然 估计 分 别 为 5, = 0.0735 Ale, = 0.480 3. W 
量 误差 比 状态 新 息 有 更 大 的 方差 , 这 证 实 了 一 天 内 的 高 频 收 益 率 要 受到 测量 误差 的 
约束 . 估计 的 细节 将 在 113.7 节 给 出 . 这 里 把 这 两 个 估计 看 成 是 给 定 的 , 并 且 只 是 
用 该 模型 来 说 明 卡 尔 曙 滤波 的 应 用 . 


11.1.1 ”统计 推断 


回 到 (11.1) 式 和 (11.2) 式 的 状态 空间 模型 . 分 析 的 目的 是 由 数据 (ut = 
1,… T} 和 模型 来 推断 状态 jw 的 性 质 ， 文 献 中 经 常 讨论 的 有 三 种 类 型 的 推断 . 
它们 是 滤波 (filtering)、 预测 (prediction) 和 平滑 (smoothing). $ F, = {y uw} 为 
t HA (包含 二 时刻) 已 经 得 到 的 信息 , 且 假 定 模型 (包括 所 有 参数 ) 是 已 知 的 . 下 
面 简要 描述 一 下 这 三 类 推断 . 

e 滤波 : 滤波 意味 着 给 定 F, 恢复 状态 变量 uu, 即 从 数据 中 移 除 测量 误差 . 

e 预测 : 预测 意味 着 给 定 F, 预测 pi, 或 yj, A> 0, 其 中 +t 是 预测 原点 . 

e 平滑: PERAE Fr, 估计 u, BT >t. 
关于 这 三 种 类 型 推断 的 一 个 简单 的 类 比 是 读 于 写 的 注释 .滤波 是 根据 由 注释 开始 
所 积累 的 知识 来 领会 你 要 读 的 单词 , 预测 是 猜想 下 一 个 单词 , 而 平滑 是 一 旦 你 己 经 
读 了 一 遍 注释 , 去 解释 一 个 特定 的 单词 . 

为 了 更 精确 地 描述 推断 , 我 们 引进 一 些 符 号 . 令 py = E(u|F;) 和 xy; = 
Var(u,|Fj) 分 别 为 n, 在 给 定 Fj 条 件 下 的 条 件 均值 和 条 件 方差 . 类似 地 , vu; K 
示 yi 在 给 定 F; 条 件 下 的 冬 件 均值 . 进一步 , ou =y —Ytje-1 Al V = Var(v| Fi.) 
分 别 为 向 前 一 步 预 测 误差 各 y, 在 给 定 Fui 条件 下 的 条 件 方差 . 值得 注意 的 是 ， 
预测 误差 v, 与 A, 是 独立 的 , 因此 v, 的 条 件 方差 和 无 条 件 方差 是 相同 的 ， 即 
Var(v;|F1.1) = Var(v,). 由 (11.1) 式 ， 


Yeje—1 = E(ye|Fi-1) = E(u + ei|Fii) = E(u|Fi 1) = pipa. 
因此 , 有 
Ut = Ut — Yelt—1 = Ye — Mit (11.5) 
且 
V, = Var(yi — Igi - i| Fi) = Var(yu + e, — Mtlt-1| Fia) 
= Var(ji 一 Mje—1|Ft-1) | Var(edEi-i) = Ert- + ez. (11.6) 
很 容易 看 出 ， 


E(w) = E[E(vi| F-1)] = E[E(ye — yqi-ilFi-i)] = 也 [一 = 0, 
Cov(v,4y) = E(vey;) = E[E(vy;|Fi-1)] = ElyyE(w|Fi 1)] =0 j «€ t. 
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于 是 , 如 所 料想 , 向 前 一 步 预测 误差 与 yj(; < t) 不 相关 ,从 而 独立 ， 进 一 步 , 对 
于 (11.1) 式 和 (11.2) 式 的 线性 模型 , 有 jue = Eu 及) = EUnu| 玉 iuw) B X = 
Var(u|F1) = Var(uelFi-t.u). 换言之 , 信息 集 A 可 以 写成 FA = {Fiu} = 
Uam). 

下 面 给 出 多 元 正 态 分 布 的 一 些 性 质 , 它们 对 于 研究 正 态 假定 下 的 卡尔 曼 滤 波 非 
党 有用. 可 以 利用 多 元 线性 回归 方法 或 联合 密度 的 因子 化 方法 来 证 明 这 些 性 质 , 也 
可 以 参见 第 8 章 的 附录 B. 对 于 随机 向 量 w 和 m, 其 均值 向 量 和 协 方差 矩阵 分 别 
表示 为 E(w) = py, E(m) = n,, Al Cov(m, w) = Xiny. 
定理 11.1 假设 z,y,z 是 联合 分 布 为 多 元 正 态 分 布 的 随机 向 量 . 另外 , 对 于 w = 
s, yz, 假定 对 角 分 块 协 方差 矩阵 Dow 是 非 奇 异 的 , H. €,. — o. 则 

(1) E(z|y) = E *XSZE.(y— ind 

(2) Var(zly) = Bex — Ere Eg! Dye 

(3) E(z|y, z) = fan Xe Ez e — is) 

(4) Var(z|y, z) = Var(zly) — Ea: 3:2 Dee. 


11.1.2 卡尔 曼 滤 波 


卡尔 曼 滤 波 (Kalman filter) 的 目标 是 : 当 获 得 一 个 新 的 数据 点 时 递归 地 更 新 状 
态 变量 的 信息 . 即 已 知 p 在 给 定 Fia 条 件 下 的 条 件 分 布 和 新 数据 y, 我 们 意欲 
得 到 ju 在 给 定 Fi 条 件 下 的 条 件 分 布 , 与 前 面 一 样 , 这 里 Fj = {wi,…: , 奶 }. 由 于 
F, = (Fia v) ATM Aa RI v, 与 给 出 A. Aly, 是 等 价 的 . 因此 , 我 们 只 要 
知道 (me v)! 在 给 定 Fea 条 件 下 的 条 件 分 布 , 便 可 以 利用 定理 11.1 推导 出 卡尔 曼 
滤波 . 

vt 在 给 定 Fi 条 件 下 的 条 件 分 布 是 均值 为 零 的 正 态 分 布 , 方差 由 (11.6) 式 给 
出 ; ju 在 给 定 Fia 条 件 下 的 条 件 分 布 也 是 正 态 分 布 , 且 其 均值 为 py. 272898 
Xa 进一步 (Hs Ve)’ 在 给 定 Fei 条 件 下 的 条 件 分 布 也 是 正 态 的 . 因此 , 剩 下 的 
问题 是 求 出 jw 和 wi 在 给 定 Fy 条 件 下 的 条 件 协 方差 . 由 定义 ， 


Cov (pr, vi| F1) = E(meve|Fe-1) = Elpi(ys — pti) B71] (H Eq. (11.5)) 
= Elpe (je + er — pei) | Fia] 
= Eun — Meje—1)| Fei] + E(uree| Ft) 
= El (pe — nae 1)?| Fea] = Var (pue Fia) = Yap i (11.7) 


这 里 我 们 用 到 了 Elan (ee — pci) F] = 0. 将 上 述 结果 综合 在 一 起 , 我 们 有 


ls TT HE ia wd Xi Eit- | 
Ut] p. 0 Vera Vi 
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由 定理 11.1 AH. yu 在 给 定 Fi 条 件 下 的 条 件 分 布 是 正 态 的 , 且 均 值 和 方差 分 别 为 


uiv 


Hilt = Mejt—1 + UM = papi + Ker, (11.8) 
Die 1 
Lele = Xi => V, — Xn-i1(1— Ke), (11.9) 


其 中 Ki = Xu a/Vi 是 ua KF v MEISTE AR, 通常 称 为 卡 汞 受 增 益 (Kalman 
gain). 由 (11.8) 式 知 , 卡尔 曼 增益 决定 了 新 扰动 w 对 状态 变量 j 的 贡献 . 

接 下 来 , 我 们 可 以 通过 (11.2) 式 利用 必 在 给 定 Fi 条 件 下 的 信息 来 预测 po 
具体 地 , 我 们 有 


Werle = E(p + mel Fr) = E(u|FI) 三 Al (11.10) 
Map = Var ( pir44 Fy) = Var (pur | Fy) + Var(7) = Lele VN az. (11.11) 


一 旦 观测 到 新 的 数据 点 ye, 便 可 以 重复 上 面 的 步骤 来 更 新 ae 的 信息 . 这 就 是 
著名 的 卡尔 曼 滤 波 算法 . 该 算法 由 卡尔 曼 于 1960 年 提出 . 

综 上 所 述 , 将 (11.5) 一 (11.11) 式 放 在 ”起 , 在 初始 假定 , 即 ji 的 分 布 是 N (pilo, 
Eio) 成 立 的 条 件 下 , 局 部 趋势 模型 的 卡尔 曼 滤波 为 


Ve=Ye  Meje—1s 

Ve = Ett- + 02， 

Kt= Yi/ WV, (11.12) 
Witilt = Bici + eve, 


Yap ~ Erea (1 — Ke) o2, $e, T. 


卡尔 曼 滤 波 的 推导 方法 有 很 多 种 . 为 了 简便 , 我 们 这 里 是 利用 定理 11.1, 即 多 
元 正 态 分 布 的 性 质 来 推导 的 . 在 实际 中 , 初始 值 /al 和 Ejo 的 选取 值得 注意 . 关 
于 该 问题 我 们 将 在 11.1.6 节 进 行 讨论 . 对 于 (11.1) 式 和 (11.2) 式 给 出 的 局 部 趋势 
模型 , 参数 c, 和 o, 可 以 通过 最 大 似 然 方 法 估计 出 来 . 此 外 , 在 估计 过 程 中 , 卡尔 
曼 滤波 在 求 数据 的 似 然 函 数 时 也 很 有 用 . 我 们 将 在 11.1.7 节 讨 论 估计 问题 . 
例 11.1( 续 ) ”为 了 说 明 卡 尔 曼 滤波 的 应 用 , 我 们 给 Alcoa 股票 收益 率 的 日 已 实现 
波动 率 拟 合 了 状态 空间 模型 并 将 卡尔 曼 滤波 算法 应 用 于 该 数据 , 这 里 Ejo = oc, 
pio = 0. 11.6 节 将 讨论 这 些 初始 值 的 选取 . 图 11-2a 给 出 了 滤波 状态 变量 jy 的 
时 间 图 , 图 11-2b 给 出 了 向 前 一 步 预测 误差 v, 的 时 间 图 . 与 图 11-1 比较 , 滤波 状态 
更 平滑 . 预测 误差 似乎 很 稳定 地 分 布 在 0 的 附近 , 并 且 以 0 为 中 心 . 这 些 预 测 误差 
都 是 样本 外 向 前 一 步 预测 误差 . 
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(a) 滤波 状态 变量 
1.6 
K 1.2 

$s 

A 0.8 
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天 W 
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gem. 
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图 11-2 ”基于 局 部 趋势 状态 空间 模型 , FER A RIVA Alcoa 股票 日 对 数 已 实现 波动 
Air TAF BY EEA: (a) 滤波 状态 uu: (b) 向 前 1 步 预 测 误差 v, 


11.1.3 ”预测 误差 的 性 质 


向 前 一 步 预测 误差 {w} 在 很 多 应 用 中 都 很 有 用 , 因此 它们 的 性 质 值 得 我 们 仔 
细 研 究 . 给 定 初 始 值 Da jo 和 pay jo AMES y, 独立 ), 卡尔 曼 滤 波 使 得 我 们 可 以 递归 
地 计算 w, 这 里 w 是 {yi,… ,yt} 的 线性 函数 . 具体 地 说 , 通过 重复 替代 , 我 们 有 


U|1 —UV1 — Hao: 
U2—g2 — Hoji = ya — Hijo — Ki (yı — Hijo) 
v3 —3 — Ha|2 = ya — Hijo — Ka(ya — Hijo) — Kı (1 — K2)(yi — Hijo), 


等 等 , 此 变换 可 以 写成 如 下 矩阵 形式 
v = K(y — Hl17); (11.13) 


其 中 v= (vi, > sur)’, y= (yi. ur), lr 是 I i oft: BAL ANY 5] EE, K 是 下 三 角 和 矩阵 ， 
且 定 义 如 下 : 


1 0 0 0 

kay 1 0 vee 0 

K= | kai kg 1 0 
kri kra kra --- 1 


其 中 kiii = —Ki-1 B kij = —(1— Ki-1)(1- Ki-2) +++ (1 — Kj;4,1)K;(i =2,--- ,T, 
J 三 1…… 必 一 2). 需 昌 说 明 的 是 , 从 定义 上 看 , PRS Ke 既 不 依赖 于 uio 也 
不 依赖 于 [yis . n) 而 是 依赖 于 Yo, cz 和 go. 
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(11.13) 式 的 变换 有 一 些 重要 推论 . 首先 {w} 在 正 态 假设 条 件 下 是 彼此 独立 的 . 
为 了 说 明 这 点 , 考虑 数据 的 联合 概率 密度 函数 


T 
ply m) = plu) L[»(v;l5ji)- 


j=2 
(11.13) 式 指出 从 y, 到 v, 的 变换 是 一 个 单位 Jacobian 矩阵 , 因此 有 plv) = p(y). 
再 者 , 只 要 uio 给 定 , W p(vi) = ply). 因此 , v 的 联合 概率 密度 函数 是 


T' "p, T. 
plv) = ply) = pin) [T7»(v,15j:) = (rr) [ [»tv;) = ] [ p). 
j-2 j j=2 


上 式 说 明 {fw} 是 彼此 独立 的 . 

其 次 , 卡尔 曼 滤波 给 出 了 y 的 协 方差 矩阵 的 一 个 Cholesky 分 解 . 为 了 说 明 这 
点 , V Q = Cov(y). 从 (11.13) 式 可 知 Cov(v) = KOK’, 此 外 , {v} 彼此 独立 且 有 
Var(v;,) = Vj. 因此 KOK’ = diag{Vi,… , Vr}, 这 正 是 Q 的 一 个 Cholesky 分 解 . 
ERE K 的 元 素 ky 有 一 个 很 好 的 解释 , 参见 第 10 章 . 

状态 误差 的 递归 

再 看 状态 变量 u 的 估计 误差 . 定义 


Ti = Ht — Hte 


为 状态 变量 wi 在 给 定 Foo 条 件 下 的 预测 误差 . 由 11.1.1 节 可 知 , Var(z| Fi_1) = 
Eaei: 由 (11.12) 式 的 卡尔 曼 滤 波 , RATA 
Ut = Yt: Ptjt-1 = Me + Hiji = Te €t, 
和 
Tii = Hep — Boer = pa + T — (up + Kerr) 

= Tt +m — Aime = te +m — K(x + e+) = Ina, + Th — Kees, 
其 中 Li = 1 — Ke = 1 — Sepa /Vi = (Vi — Depa) /Vi = 0 2/Vy. 因此 对 于 状态 误差 ， 
我 们 有 

Ut — Tt t Ct, Tttl = Lyst T- Tk. — Ke, = T. (11.14) 
其 中 有 zi = uy -uyo (11.14) 式 是 带 有 状态 变量 x 和 观测 值 w 的 时 变 状态 空间 
模型 . 
11.1.4 状态 平滑 

Fifi, 我 们 考虑 状态 变量 (ui, ,uz) 在 给 定数 据 Fr 和 模型 时 的 估计 . BU, 给 


XE (11.1) 式 和 (11.2) 式 的 状态 空间 模型 , 对 所 有 时 间 t, 我 们 希望 得 到 条 件 分 布 
u| Fr. 为 此 , 我 们 首先 回顾 一 下 该 模型 所 包含 的 一 些 事实 . 
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e. 所 有 涉及 到 的 分 布 都 是 正 态 的 , 5 t< T 时, 我们 可 以 将 u 在 给 定 及 条 件 下 
的 条 件 分 布 写作 N (uyr: Zar). 我 们 称 ur 29 t 时 刻 的 平滑 状态 (smoothed 
state) 而 Ear 称 为 平滑 状态 方差 (smoothed state variance). 

e 由 11.1.3 WP {v} WEEET AN, {v vor) 彼此 独立 目 为 Ta ur} 的 
线性 函数 . 

e 如 果 y, yr 是 确定 的 , 则 F, a 和 fo :or} 都 是 确定 的 , 反之 亦 然 . 

e [vn vp) 和 Fe 是 独立 的 且 均 值 为 0、 方差 为 Var(uj) 三 仿 (7 2 t). 

对 于 {unun -or} 在 给 定 Fi 条 件 下 的 条 件 联合 分 布 应 用 定理 11.1(3)， 

我 们 有 


hiar = E(mlFr) = E(pi|Fi-1, t+ ,vr) 


= E( m| Fi—1) + Covljis (tes , vrY]Cov[Go, - ory] tw + pur) 


, 一 】 
Cov (ple, Ue) V, 0 esp UL 
Cov (jit, Uri 1) 0 Vui c- 0 Uti 
= ptpi-1 十 s ] > 1 
Cov(pe, vr) 0 0 soe Vr UT 
T 
一 ?4 一 1 EZ M Covlju, vj)V; vj. (11.15) 
jet 


M {vz} 的 定义 和 独立 性 可 知 ， Cov (the, vj) Coví(r,, vj)(j = 1, wr diis H 
Cov (zr, v) = Efer (ae + et)] = Var(zt) = Xii 
Cov(ae, v41) = E[rc( zia + eer1)] = Elae(Lere + m — Krer)) = Eit- Le. 


类 似 地 , 我 们 有 


Cov(wr Ve+2) = Elae(wt+2 + et+2)] = --- = Eit- LtEtt, 


ss 


T— 1 
Cov(a, vr) = E[z,(rr 十 er)| =.= Deie—1 II Lj. 
j=t 


因此 , (11.15) 式 变 为 


vt Ui--1 Vi+2 
Her = Hit- + Eqiiy t Eq T Eei Leli Visa Te 


= pea + Nadia: 


其 中 
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T—1 
Ut Uti Vi+2 UT 
a = > +L LiL Tee L; | — 11.16 
dt-1 V; ty "S t ty, io (0 ) Vr ( ) 


是 新 息 (0. sor) 的 加 权 线 性 组 合 . 该 权重 和 满足 


因此 , 利用 初始 值 gr = 0, 我 们 得 到 向 后 的 递归 


qi Te + Lean, ee oo ee Oe N (11.17) 
t 


综合 考虑 (11.15)—(11.17), 我 们 得 到 一 个 计算 平滑 状态 变量 的 向 后 递归 算法 : 
di — V ww Lig, pyr = Beyer + Doig t=T,--- ,1, (11.18) 


其 中 gr = 0, H teis Seje-1 A Ly 由 (11.12) 式 中 的 卡尔 曼 滤 波 给 出 . 
平滑 状态 方差 
平滑 状态 变量 的 方差 uyr 可 以 通过 定理 11.1(4) 用 相似 的 方式 推导 出 来 . 具体 
Hh, 令 oP = (vu vor, 则 我 们 有 
Bar — Var(p| Fr) = Var(p|Fr_i, Vts yur) 
= EURE Covlpu, (vi )']Cov[(v? )] ^ Cov[ui, (v7 )] 
= Tia — S [Covi y) V; (11.19) 
j=t 


其 中 Cov(u,, vj) = Cov(z,,v;) 如 先前 (11.15) 式 后 给 出 的 . 因此 


1 1 1 
Ear = Di — Pha — UF, bP? —— -—--e—E L? | 一 
"UT t[t—1 t|t—1 V; tjt—1^*t Yu tjt-1 H 3] Vr 
= Lit- — Deer Met, (11.20) 


其 中 


—1 
1 1 1 
2 2 2 
Meam vou 4- L2 Haye (iI z) a 
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是 时 刻 t—1 后 向 前 1 步 预 测 误差 方差 倒数 的 加 权 线 性 组 合 . 因为 得 不 到 时 刻 T 后 
向 前 1 步 误差 , 所 以 令 Mr = 0. 统计 量 Mi 具有 形式 


1 gi T eS 
Mie, A 5452 le I2 e II 4) d 
j=t+1 


E. - T PES d 
= 元 + +LeM, t=T,T—1, S: 


由 (11.16) 式 和 {u} 的 独立 性 , 我 们 有 


1 er ul 1i 
Var(q, )eg4 Lut Li LT =M. 


综合 考虑 上 述 结果 , 平滑 状态 变量 的 方差 很 容易 通过 向 后 回归 计算 出 来 
Ma=W +ItM, Eyr = Eiei -DaM t=T, — (1121) 


其 中 Mr = 0. 

例 11.1( 续 ) ”利用 给 Alcoa 股票 的 日 已 实现 波动 率 所 拟 合 的 状态 空间 模型 , 将 卡 
尔 曼 滤波 和 (11.18) 式 与 (11.21) 式 的 状态 平滑 算法 应 用 于 其 中 , 我 们 很 容易 计算 
出 滤波 状态 ue, 平滑 状态 ur 和 它们 的 方差 . 图 11-3 给 出 了 滤波 状态 变量 和 它 
的 置信 水 平 为 95% 的 逐 点 置信 区 间 的 时 间 图 , 而 图 11-4 给 出 了 平滑 状态 变量 和 它 
的 置信 水 平 为 95% 的 逐 点 置信 区 间 的 时 间 图 . 如 所 料想 , 平滑 状态 变量 比 滤 波状 态 
变量 要 平滑 一 些 . 平滑 状态 变量 的 置信 区 间 也 比 滤波 状态 变量 的 置信 区 间 穿 . 值得 
注意 的 是 , way. 的 95% 的 置信 区 间 的 宽度 依赖 于 初始 值 Xio. 


图 11-3 ”基于 给 Alcoa 股票 收益 的 日 对 数 已 实现 波动 率 所 拟 合 的 局 部 状态 空间 模型 , 给 出 
滤波 状态 变量 uu, 和 它 的 置信 水 平 为 95% 的 逐 点 置信 区 间 
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图 11-4 ”基于 给 Alcoa 股票 收益 的 日 对 数 已 实现 波动 率 所 拟 合 的 局 部 状态 空间 模型 , 给 出 
平滑 状态 变量 uyr 和 它 的 置信 水 平 为 95% 的 逐 点 置信 区 间 


11.1.5 REE 


状态 空间 模型 的 优势 在 于 处 理 缺失 值 . 假设 观测 值 (uu) ， 是 缺失 的 (h > 1 
且 1< £ « T). 在 状态 空间 的 公式 里 有 好 几 种 处 理 缺失 值 的 方法 . 我 们 考虑 其 中 一 
种 方法 使 得 原始 的 时 间 刻 度 和 模型 形式 保持 不 变 . 对 于 te {4 十 1,… Hh), 根据 
(11.2) 式 , u, 可 以 表示 为 wey 和 {my} 沁 ,的 线性 组 合 来 表达 . 具体 地 ， 


t-1 
Me = Me-1 + M-1 = ++" = nea + >. js 
j=4+1 


其 中 , 如 果 求 和 式 的 下 界 比 上 界 还 大 则 该 求 和 式 为 0. 因此 对 于 te {€+1,--» +h} 
也 (Hi 及 一) = E(ur| Fe) = Hae 
Var( p| Fi—1) 一 Var (p| Fy) = TET T (t 一 /一 1)oz. 
所 以 , XF t= 42, hs 我 们 有 


Mejt—1 = Me-ajt-2, Bejt-1 = Dt-ilt-2 05, (11.22) 


这 些 结果 表明 , 当 t = 二 1… ,4 十 hh BY, 我 们 可 以 继续 利用 (11.12) 式 的 卡尔 最 滤 
波 算法 , 此 时 v, — 0, Ki = 0. 这 是 很 自然 的 , 因为 当 ye GRAM, 将 没有 新 的 新 息 或 
者 新 的 卡尔 曼 增益 , 因此 有 w=0 和 K, = 0. 


11.1.6 ”初始 化 效应 


本 小 节 将 考虑 初始 条 件 wi ~ IN (uio, Zio) 对 卡尔 曼 滤波 和 平滑 状态 的 影响 . 
由 (11.12) 式 的 卡尔 曼 滤波 


Ui-y —o = Yo * Tas 
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且 由 (11.8)—(11.11) Ñ, 


Yo Yo 
Hai = pao + EH = [|o + Ei o2 (yi — pao); 


: Yi Zijo 2 
Y24 = Dito (= = c2. 
2| 110 ( Erot =) 十 0m Yu r HOn 


因此 , BE Eio 增 大 到 无 穷 , RATA uai =m 且 Yon = 67 +07. 这 等 价 于 将 y 看 
作 不 变 , 且 假定 u ~ N(ui,02). 在 文献 中 , 这 种 初始 化 卡尔 曼 滤 波 的 方法 叫做 扩散 
初始 化 (diffuse initialization), 因为 Ei 取 值 很 大 意味 着 初始 条 件 的 不 确定 . 

下 面 , 再 看 扩散 初始 化 对 状态 平滑 的 影响 . 很 显然 , 基于 卡尔 曼 滤波 的 结果 , 状 
态 平滑 不 受 扩散 初始 化 的 影响 (t= T,… ,2). 因此 , 我 们 主要 讨论 给 定 Pr 条 件 下 
的 ui 由 (11.18) 式 和 Li 一 1 一 Ki 二 V1o2 HEM, 我 们 有 


par = Hijo + Erogo 


= mijo + Eo Iz m T" (1 = žilo ) a| 
Eio + 02 Yo 4-02 

Xp 

io + o2 

BE Eijo — oo, 我 们 有 uir =uyotrut+o2n =y +o2q, 进一步 , 由 (11.21) XX, 并 

利用 Vi = Eio 4-02, 我 们 有 


1 Zijo 1 
ia 2 o a 
21IT = Yo — Eijo Inca E (i- ze) "s 
Yo ) ( Yo ) 2 
-Xy[1- -pk- 210M 


Yo Bo Y 
E ez : A a= (a + =) eM 
因此 ， 令 Mo — OQ, 我 们 得 到 Dir = a2 = ciM;. 
基于 上 述 讨论 , 我 们 建议 在 对 初始 值 ut 了 解 较 少 的 情况 下 利用 扩散 初始 化 . 
然而 , 在 实际 应 用 中 , 可 能 很 难 判 断 当 随机 变量 具有 无 限 方差 时 使 用 此 方法 的 可 行 
性 . 如 果 有 必要 , 可 以 将 us 看 作 状 态 空间 模型 的 附加 参数 , 并 可 与 其 他 参数 一 起 估 
计 出 来 . 后 一 种 方法 和 第 2 章 与 第 8 章 的 精确 最 大 似 然 估计 密切 相关 . 


11.1.7 ‘ait 


本 小 节 将 考虑 由 (11.1) AA (11.2) 式 给 出 的 局 部 趋势 模型 中 ce Alo, 的 估计 . 
基于 11.1.3 节 所 讨论 的 预测 误差 的 性 质 , 卡尔 曼 滤波 给 出 了 计算 数据 最 大 似 然 函 
数 的 一 个 有 效 的 方法 . 具体 地 , 正 态 假设 下 的 似 然 函 数 为 


= pao + 5 (v1 + c2qi). 
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—————Ooooooooee — 


n 
Ps 77 rige Om) = pilae on) [ [ (Yel Fe-1, Fe, 04) 


t=2 


T 
= P(yi lee, 74) LIGUE: o. On), 
t—2 
FEP yy N(uio Vi) E v = (y, — uii) ~ N(0, V). 因此 , 若 假定 wilo RI Dayo 已 
知 并 取 其 对 数 , 我 们 有 


T 
In[L(o., 04)] = -i In(2x) — >> (mtv) 十 i) ; (11.23) 


t=1 


上 式 包含 v, 和 V. 因此 , 包括 缺失 值 在 内 的 对 数 似 然 函数 ， 可 以 通过 卡尔 曼 滤波 
递归 地 计算 出 来 ， 许 多 软件 包 比 如 Matlab, RATS 和 S-Plus 等 都 可 以 通过 卡尔 
曼 滤 波 法 则 进行 状态 空间 模型 的 估计 . 本 章 中 , 我 们 利用 Koopman, Shephard 和 
Doornik(1999) 开发 的 SsfPack 程序 , S-Plus 与 OX 都 包含 该 程序 . SsfPack 和 
OX 可 以 从 它们 的 网 页 上 免费 下 载 . 


11.1.8 ”所 用 的 S-Plus 命令 


这 里 我 们 给 出 对 Alcoa 股票 收益 率 的 日 已 实现 波动 率 进行 分 析 的 Ss f Pack fi 
令 , 并 给 出 简要 的 说 明 . 对 于 所 用 命令 的 详细 细节 , 可 以 参考 Durbin and Koop- 
man(2001, 6.6 $7). S-Plus 使 用 特定 的 符号 来 指定 状态 空间 模型 . 参见 表 11-1. 这 
些 符 号 必须 完整 无 误 . ER 11-2 中 , 我 们 给 出 了 一 些 命令 和 它们 的 功能 . 


R 11-1 ”状态 空间 形式 和 S-Plus 中 的 符号 状态 空间 参数 


状态 空间 参数 S-Plus 名 
ó mDelta 
$ mPhi 
2 mÜmega 
£ 


# 11-2 SsfPack 包 的 一 些 命令 


fir + 功 能 
SsfFit 最 大 似 然 估计 
CheckSsf 在 S-Plus 中 创建 对 象 **Ssf， 
KalmanFil 执行 卡尔 最 滤波 
KalmanSmo 执行 状态 平滑 
SsfMomentEst with task *'STFIL'" 计算 滤波 状态 及 方差 
SsfMoentEst with task **STSMO'' 计算 平滑 状态 及 其 方差 
SsfCondDens with task ‘‘STSMO'’ 计算 不 带 方差 的 平滑 状态 


在 我 们 的 分 析 中 , 我 们 首先 对 (11.1) 式 和 (11.2) 式 的 状态 空间 模型 进行 最 大 
似 然 佑 计 , 得 到 re 和 o 的 估计 . 初始 值 Xu = -1 B. wilo —0,3X HH. «—1" 表示 扩 
散 初 始 化 , 即 , Eio 很 大 . 这 时 , 我 们 把 所 拟 合 的 模型 看 成 是 已 知 的 然后 进行 卡尔 
曼 滤波 和 状态 平滑 . 
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状态 空间 模型 的 Ssf Pack 命令 和 S-Plus 命令 


> da = matrix(scan(file-'aa-rv-0304.txt'),2) * load data 
> y = log(da[i,]) * log(RV) 


v 


ltm.start-c(3,1) % Initial parameter values 


> Pl = -+ $ Initialization of Kalman filter 

> al = 0 
ltm.m=function (parm) { % Specify a function for the 
sigma.eta=parm [1] % local trend model. 


sigma.e=parm [2] 

ssf.m=list (mPhi=as.matrix(c(1,1)), 
momegas-diag(c(sigma.eta^2,sigma.e^2)), 
mSigma-as.matrix(c(P1,a1))) 

CheckSsf (ssf.m) 

) 

perform estimation 
ltm.mle-SsfFit(itm.start,y,"ltm.m",lower-c(0,0), 
upper=c (100,100) ) 

> ltm.mle$parameters 

[1] 0.07350827 0.48026284 

> sigma.eta-ltm.mle$parameter[1] 

> sigma.eta 

[1] 0.07350827 

» sigma.e-ltm.mle$parameters [2] 

> sigma.e 

[1] 0.4802628 

Specify a state-space model in S-Plus. 
> ssf.ltm.list-list(mPhi-as.matrix(c(1,1)), 
+ mOmegas-diag(c(sigma.eta^2,sigma.e^2)), 
4 mSigma-as.matrix(c(P1,a1))) 

% check validity of the specified model. 
> 

> 


Pe 


ae 


ssf.ltmsCheckSsf (ssf.ltm.list) 
ssf.ltm 


[,1] [,2] 
[1,] 0.0054035 0.0000000 
(2,] 0.0000000 0.2306524 
$mSigma: 
[,1] 
[1,] -1 
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[2,] 0 
SmDelta: 
[,1] 
[1,] 0 
[25:1 0 
$mJPhi: 
[1] 0 
$mJOmega : 
[1] 0 
$mJDelta: 
[1] 0 
Smx: 
[1] 0 
ScT: 
[1] 0 
SCA: 
[13 6 
Sey: 
[z] 2 
$cSt: 
HI 
attr(, "class"): 
[1] "ssf" 
% Apply Kalman filter 
> KalmanFil.1ltm=KalmanFil (y,ssf.ltm,task="STFIL") 
> names (KalmanFil.ltm) 


[1] "mout" "innov" "std.innov" "mGain" "loglike" 
[6] "loglike.conc" "dVar"  "mEst" "mOffP" "task" 
[11] "err" "call" 


par (mfcol=c (2,1)) % Obtain plot 

plot (1:340,KalmanFil.ltm$mEst [,1],xlab-'day', 
ylab-'filtered state’ ,type='1') 

title (main=' (a) Filtered state variable’ ) 
plot(1:340,KalmanFil.ltm$mOut[,1],xlab-'day', 
ylab-'v(t)',types'1') 

title (main-' (b) Prediction error') 

Obtain residuals and their variances 
KalmanSmo.ltm-KalmanSmo (KalmanFil.ltm,ssf.ltm) 

names (KalmanSmo.]tm) 

[1] "state.residuals" "response.residuals" "state.variance" 
[4] "response.variance" "aux.residuals" "scores" 

[7] "call" 

* Next, filtered states 

> FiledEst.ltm-SsfMomentEst (y, ssf .ltm, task-"STFIL") 

> names (FiledEst.ltm) 

[1] "state.moment" "state.variance" "response .moment" 
[4] "response.variance" "task" 


本 


v 
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* Smoothed states 
» SmoedEst.ltm-SsfMomentEst (y,ssf.ltm,task-"STSMO") 
> names (SmoedEst.ltm) 
[1] "state.moment" "state.variance"  "response.momernt" 
[4] "response.variance" "task" 
Obtain plots of filtered and smoothed states with 95$ C.I. 
up-FiledEst.ltm$state.moment + 
2*sqrt (FiledEst.ltm$state.variance) 
lw-FiledEst.ltm$state.moment - 
2*sqrt(FiledEst.ltm$statc.variance) 
par (mfcol=c (1,1)) 
plot(1:340,FiledEst.ltm$state.moment,type-'l',xlab-'day', 
ylab='value’ ,ylim=c(-0.1,2.5)) 
lines (1:340,up,1ty=2) 
lines (1:340,1w, lty=2) 
title (main=’Filed state variable’) 
up-SmoedEst.ltm$state.moment + 
2*sqrt (SmoedEst .ltm$state.variance) 
lw-SmoedEst.ltm$state.moment - 
2*sqrt (SmoedEst.itm$state.variance) 
plot(1:340,SmoedEst.ltm$state.moment,type-'l',xlab-'day', 
ylab-'value',ylim-c(-0.1,2.5)) 
lines(1:340,up,lty-2) 
lines (1:340,1w, lty=2) 
title(main=‘Smoothed state variable’) 
Model checking 
resi=KalmanFil.ltm$mOut [,1)*sqrt (KalmanFil.1ltm$mOut [, 3] ) 
archTest (resi) 
autocorTest (resi) 


对 于 Alcoa 股票 收益 的 日 已 实现 波动 率 , 基于 残 差分 析 , 局 部 趋势 模型 是 充分 
的 ， 具 体 地 , 对 于 给 定 的 参数 估计 , 利用 卡尔 曼 滤波 得 到 向 前 1 步 预 测 误差 v, 和 
它 的 方差 Vi. 然后 计算 标准 预测 误差 9, = v/v V, 并 检查 序列 相关 性 和 (0,) 的 
ARCH 效应 . 我 们 发 现 对 于 标准 预测 误差 有 Q(25)=23.37(0.56) 且 检 验 ARCH 效应 
的 延迟 为 25 的 LM 检验 统计 量 是 18.48(0.82), 其 中 括号 里 的 数字 表示 p 值 . 


ww 


11.2 ”线性 状态 空间 模型 


现在 我 们 考虑 广义 的 状态 空间 模型 ， 许 多 经 济 和 金融 上 的 动态 时 间 序 列 模型 

可 以 表示 成 状态 空间 模型 的 形式 , 例如 ARIMA 模型 、 带 有 不 可 观测 元 素 的 动态 线 

性 模型 , 时 变 回归 模型 和 随机 波动 率 模型 . 广义 高 斯 线性 状态 空间 模型 具有 如 下 形 
式 

8141 = A+ Ts, + Rim, (11.24) 


y, = Ce + Zest + €t, (11.25 ) 
其 中 8, = (816,7 = , Smt). 是 Th 维 状态 向 量 ， Yı 一 (Yit: ai Uke). 是 k 维 观测 向 量 ， di 
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和 c, 分 别 是 m 维和 大 维 的 确定 性 向 量 , T, 和 2, 分 别 是 m x m Ak x m 的 系数 
和 矩阵, R, 是 m x n 矩阵 , Arh m x m 单位 矩阵 的 子 列 构成 , HL im} 和 (ei) 分 
别 是 n 维和 维 高 斯 白 噪 声 序列 满足 


T]; ^ N(0,Q,), €i ~ N(0, H,), 


其 中 Q, 和 Hy 是 正定 矩阵 我 们 假定 {m} 和 (e) 是 独立 的 , 但 是 在 必要 的 时 候 
这 个 条 件 可 以 放松 . 初始 状态 si 服从 IN (uio. Yao), 其 中 uro 和 Zijo 是 给 定 的 ， 
且 对 于 二 > 0, er 与 n, 独立 . 

(11.25) 式 是 度量 或 者 观测 方程 . 该 方程 给 出 了 观测 值 y, 与 状态 向 量 s 解释 
变量 c, 和 测量 误差 e 的 联系 . (11.24) 式 是 状态 或 转移 方程 . 它 描述 的 是 带 有 新 息 
m 的 一 阶 马尔 科 夫 链 . 该 马尔 科 夫 链 决定 了 状态 的 转移 . 矩阵 Te R, Qis Z 和 
H, WOM AMIN RRE. 这 些 矩 阵 通 常 是 稀疏 的 . 它们 是 某 个 参数 9 的 函数 ， 
且 参 数 0 可 以 通过 最 大 似 然 方法 估计 . 

(11.24) 式 和 (11.25) 式 的 状态 空间 模型 可 以 被 改写 成 如 下 更 紧凑 的 形式 


ira = 6: + Bist + uy (11.26) 
t 


d T 
ó, = 2 - UU kar ti = ics 


€i 


而 且 {eee} 是 高 斯 白 噪 声 序列 , 其 均值 为 0、 协 方差 矩阵 为 


RAQR 0 
0 H; | 


其 中 


Q, = Cov(u,) 一 | 


扩散 初始 化 可 以 通过 

Zijo == X. a Ais; 
得 到 . 其 中 x, Al. 是 m m 的 对 称 正定 矩阵 , 日 为 大 的 实数 , 可 以 取 到 无 限 . 
在 S-Plus 和 SsfPack 中 , 使 用 符号 


| 
参见 表 11-1. 

在 许多 应 用 中 , 系统 矩阵 不 随时 间 而 变 . 然而 ， 这 些 和 矩阵 也 可 以 是 时 变 的 , 这 使 
得 状态 空间 模型 更 加 灵活 . 
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为 了 领略 状态 空间 模型 的 灵活 性 , 我 们 将 一 些 著名 的 经 济 和 人 金融 模型 写成 状态 
空间 模型 的 形式 . 


442 第 11 章 状态 空间 模型 和 卡尔 曼 滤 波 


11.3.1 ” 带 时 变 系 数 的 CAPM 
首先 , 考虑 带 时 变 截 距 和 斜率 的 资本 资产 定价 模型 (CAPM). 该 模型 为 


mi 一 Qt 十 Brart 十 et € ~ N(0,02), 
Ti^ N(0, 02), 
Et ^» N(0, c2), 


Ott -1 = Qt + TH, (11.27) 
Bri Bi Et, 


其 中 rt 为 某 项 资产 的 超额 收益 , rw 是 市 场 超额 收益 , 且 新 息 (er, m ec) 是 彼此 独 
立 的 . 该 CAPM 里 面 的 参数 a 和 有 以 随机 游 动 的 形式 随时 间 变 化 . 我 们 可 以 很 容 


易 地 将 模型 改写 为 T 
te ls el la] RU 


Q 
Tgi = (1, T M. [2 T 86 


因此 , 时 间 序 列 CAPM 模型 是 状态 空间 模型 的 一 个 特例 , 其 中 st — (at, be) Te = 
R, = I1; 是 2 x 2 单位 矩阵 , d, = 0,& = 0,2, = (rui) Hi = o; H Q, = 
diag{o2,02}. 进一步 , 由 (11.26) 式 我 们 有 6, = 0, ue = (me, Et, e), 


1 0 c; 0 O0 
$,—|0 1 y; B=] 0 o 0 
l TMt 0 0 c? 
如 果 利 用 扩散 初始 化 , 则 
-1 0 
=| 0 -1 
0 Q0 


时 变 序 列 模型 的 SsfPack/S-Plus 命令 详 述 
对 于 (11.27) 式 的 CAPM, 9, 包含 rye, H rme 是 时 变 的 . 在 Ssf Pack 里 指 


定 这 样 的 模型 需要 一 些 特殊 的 输入 . 起 码 它 需要 两 个 附加 变量 : (a) 存储 z, 的 数 
据 矩 阵 X; (b) 识别 数据 矩阵 和 Z, 的 指标 矩阵 . de 11-3 给 出 了 (11.26) 式 中 状态 


X 11-3 SsfPack/S-Plus 中 关于 时 变 状态 空间 模型 的 符号 及 命名 
ThE Ssf Pack /S-Plus 中 的 命名 
Ji mJDelta 
Ja mJPhi 
Ja mJOmega 
Ssf Pack/S-Plus 中 的 命名 


A 
时 变数 据 和 矩阵 
x mX 
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空间 模型 的 指标 矩阵 的 符号 . 注意 , 矩阵 Jo 必须 和 矩阵 e, 有 相同 的 维 数 . 在 Ta 
的 元 素 中 , 除非 与 它 相对 应 的 e, 的 元 素 是 时 变 的 , 否则 都 设 定 为 <1". 7, 的 非 
负 指 标 表明 数据 矩阵 X 对 应 的 列 包含 时 变 值 . 

作为 说 明 , 考虑 第 9 章 中 1990 年 1 月 至 2003 年 12 月 的 General Motors 股票 
的 月 简单 超额 收益 率 . S&P 500 复合 指数 的 月 超额 收益 率 作为 市 场 收益 率 . 指定 一 
个 时 变 CAPM 需要 方差 o2, 02 和 o? 的 值 , 这 里 假定 (on, oe, oe) = (0.02, 0.04, 0.1). 
下 面 的 命令 给 出 了 如 何在 Ssf Pack/S-Plus 中 为 时 变 CAPM 指定 一 个 状况 空间 
模型 : 


> X.mtx-cbind(i,sp) * Here ‘sp’ is the market excess returns. 
> Phi.t = rbind(diag(2),rep(0,2)) 

» Sigma--Phi.t 

> sigma.eta=.02 

» Bigma.ep-.04 

> sigma.e=.1 

> Omega-diag(c(sigma.eta^2,sigma.ep^2,sigma.e^2)) 

> JPhi = matrix(-1,3,2) % Create a 3-by-2 matrix of -1. 

> JPhi[3,1)=1 

> JPhi[3,2]=2 

> ssf.tv.capm=list(mPhi=Phi.t, 

+ mOmega=Omega, 

+ mJPhi-JPhi, 

* mSigma-Sigma, 

十 
> 


mX-X.mtx) 

ssf.tv.capm 
$mPhi 

1423 7,2] 

L1, 1 0 
[2,] 0 1 
[3,] 0 0 
$mOmega: 


1,3] [,2] [,3] 
[1,] 4e-04 0.0000 0.00 
[2,] 0e«00 0.0016 0.00 
[3,] 0e«00 0.0000 0.01 


$mJPhi: 

[,1] [,2] 
[1,] 1 -1 
[2] -1 -1 
[3,] 1 2 
SmSiqma 

[,1] [,2] 
[1,] -1 0 
[2,] 0 -1 
[3,] 0 0 
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numeric matrix: 168 rows, 2 columns. 
Et, ] 1 ud Jue 
t168, ] 1 0.05002 
11.3.0 ARMA 模型 


考虑 第 2 章 中 均值 为 0 的 ARMA(p, q) 过 程 vi, 
ol Byur = 0(B)a;, aq 07 N (0, a), (11.28) 


其 中 %(B) =1- 3 内 Bi 06(B) 21— p 0;B?, Hp 和 9g 为 非 负 整数 . 有 许多 方法 


可 以 将 这 样 一 个 ARMA 模型 转化 为 状态 空间 模型 的 形式 . 我 们 讨论 文献 中 已 有 的 
三 种 方法 . 4 m= max(p,q +1) EJ (11.28) 式 中 的 ARMA 模型 重新 改写 为 


m—1 


yr = X himi Tac— 3. Ajat—j, (11.29) 
i=—1 g=1 


其 中 9, = 0(i > p) 且 9; = 0(j > q). 特别 地 , Om = 0( 因 为 m > q). 
Akaike 方法 
Akaike(1975) 将 状态 向 量 st 定义 为 包含 在 预测 原点 t 进行 预测 所 需要 的 所 有 
信息 的 变量 的 最 小 集合 . 对 于 (11.28) 式 中 的 ARMA 过 程 , 有 m = max(p,q + 1), 
= (Yejes Yt+ilt:" Ss Ym lt) : 其 中 Yt+jit = E(yt+5| Fi) 是 给 定 R = {ui " ju) 
条 件 下 Ut--j 的 条 件 期 望 . 因为 Utt = Yt, 故 St 的 第 一 个 元 素 就 是 Yt- 从 而 观测 方 
程 为 
= Zs, (11.30) 


其 中 Z = (1,0,-… ,0)ixm. 通过 以 下 几 步 推导 可 以 得 出 转移 方程 . 首先 , 由 定义 
Sitti = Ye+i = Yt+ijt + (Yea 一 yet1lt) = Su d- 0441, (11.31) 
其 中 si 是 s, 的 第 i 个 元 素 . 其 次 , 考虑 第 2 章 给 出 的 ARMA 模型 的 MA Xem, 


也 就 是 


oo 
Ye = Ae + Pitt- + 6012 os = S Vitii, 
i=0 


其 中 wo —1 E y 的 其 他 权重 可 以 通过 计算 Lo» iB! = 0(B)/d(B) 中 Bi 的 系 
数 得 到 . 特别 地 , 我 们 有 

pi =¢1 — hi; 

pa = o1Y1 + b2 — 2, 
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Wm 1 = (nima + doa 二 Bi 2V1 + bm—1 — Om-1 
m-1 


= Qiti'm-1—i = Ha (11.32) 


¢=} 
利用 MA 表示 , 对 于 7 > 0, 我 们 有 
Vizije = Elms |Fe) = E (X Vite yg in) 
i=0 
= pjat + Wj41a4-1 + pjat- + 


Al 
Yetjletl = E(yeejl Fa) = 3-186 + Vac | Pjata d 
= j-14t41 + Yerjie- 
因此 对 于 ;7 > 0 我 们 有 


Veejite = Yetslt d Wj—1at+1: (11.33) 
该 结果 称 为 ARMA 模型 的 预测 更 新 公式 . Fy. 可 以 得 到 , 该 方法 给 出 了 一 个 简 
单 的 更 新 预测 的 方法 , 即 预测 原点 从 t 变化 到 t+ 十 1. yo 的 新 信息 包含 于 新 息 rji 
中 , 基于 该 新 信息 及 权重 v; a 修 止 预测 原点 为 t 时 刻 的 预测 , 并 计算 预测 原点 为 
(t 4- 1) 时 刻 的 预测 . 
最 后 , 由 (11.29) 式 并 利用 E(awyj| F1) =0(j > 1), 我 们 有 


Vtem tei = x Pi¥t+m—ilt+1 — Im—14t41- 


$=]. 
由 (11.33) 5X, 前 面 的 等 式 变 为 


m-1 


Vt--m[t-1 = Lp Gi (Ut m—it + Vm—i-10t41) + my — 0-101241 


i=1 


m m-—1 
= Y b:¥e+-m—se + (5 Qi m-1-i 一 2 Gel 


=i iz 


= 2» Óit-m-i[t + Wm—1at+1, (11.34) 
i1 


最 后 一 个 等 式 运用 了 (11.32) R. 对 于 了 = 2,…… m— 1, 联合 (11.31) X, (11.33) 5& 
(其 中 了 = 三 2…… ,rn 一 1) 和 (11.34) 3X, 我 们 有 


Ye+1 0 1 0 ©- 0 Ut 1 
Vte2]t41 0 0 1 0 Ye+alt Un 
: =| : : : 十 : Qt41- (11.35) 
Vt--m-1|t41 0 0 0 | tt Vm-—2 


. Vt-m|t41 Om Om-1 Ó6m-2 ` Qı] [pm al Wr A 
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因此 , Akaike 方法 的 转移 方程 为 
s1 = Ts, - Rm, m ~ N(0,02), (11.36) 
其 中 Nt — Ot--1: HR T 和 R 是 (11.35) 式 中 的 系数 和 矩阵 . 
Harvey 方法 


Harvey(1993, 4.4 节 ) 给 出 了 具有 m 维 状 态 向 量 s 的 状态 空间 的 一 种 形式 . 
该 状态 向 量 的 第 一 个 元 素 是 ys 即 sn = yu se 的 其 他 元 素 通 过 递归 得 到 ， 由 
ARMA(m,m — 1) 模型 , 我 们 有 


m m-1 
Uti = oie + 3 dihri E A 8;a441—j Fi 
i—2 j=l 


= PiSit + 82: + Wh, 


m m-1 

其 中 $25 = 2, diveHi—i = 2; 0;a141—5; Tt 一 Qt41 且 如 前 述 定 义 Sit 一 Ut. 考虑 
gs j= 

82.t4-15 我 们 有 


m m-—1 
$2441 = X PiYt+2-i — > Ojat+2—j 
i=2 j=1 


™ m—1 
= doy + T PiYt+2—1 — be 0;a142—; — Pi ary1 
i=3 j=2 


= P2814 + 83: + (—O1) mM, 


其 中 sg = Y oua 一 T 0;at+2_j; 下 一 步 , 考虑 sae, 我 们 有 
t= j= 


m m-—1 
$3,441 = > PiYi4+3—1 — > 0,014.3—; 
j=2 


t=3 
m m-—1 
= d3ut 十 》 diners = E, 0jat+3-j + (—02)a141 
=4 j=3 


= $3811 + Sat + (—O2)m, 


其 中 sa, = P buc us = Ojas y 重复 上 述 过 程 , 可 以 得 到 
= I= 


m m-1 
Smt — x QiUt-m-1-i — 了 9;4t+m—1—j = bmYyt—1 — Om—144- 
1 


i—m j=m— 


Sm,t+1 = OmYt — Üm-10t41 = PmSit + (—Om—1)m- 
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将 上 述 方程 综合 起 来 , 我 们 得 到 如 下 形式 的 状态 空间 模型 : 


S51 — Ts, R, m ~ N(0,02), (11.37) 
y = Zst, (11.38) 
其 中 的 系统 矩阵 不 随时 间 变 化 且 定 义 为 Z = (1,0, ,0)ixm， 
$i 1 1 
pa ü 1 0 -和 
T=| : [s 4-| ， 
Qm-1 0 O0 ++. 1 
Om—1 
d. 0 ws b 


AL di, e, 和 H, 都 是 零 . (11.37) 式 和 (11.38) 式 的 模型 没有 测量 误差 . 它 的 一 个 优 
点 是 AR 和 MA 系数 被 直接 用 在 了 系统 矩阵 里 . 

Aoki 方法 

Aoki(1987, 第 4 章 ) 讨论 了 将 一 个 ARMA 模型 转化 为 状态 空间 模型 的 几 种 
方法 . 首先 , 考虑 MA EUM, BD y, = O(B)a,. 在 此 种 情况 下 , 我 们 可 以 简单 定义 
8, = (a, qilt q|2s77o7 04 i); 并 得 到 状态 空间 模型 形式 为 


61943 010-0 üt- 0 
Qt 一 9 十 2 0 1 0 Ut—g+1 0 
e - . > > ibe as 
at-1 0 0 0 1 ar—2 0 
at 0 0 0 = 0 Qt 一 1 
Yt = (—Oq,—Oq-1,°** ,—61)8t + ae, (11.39) 


注意 , 在 这 种 特殊 情况 下 , a 同时 出 现在 状态 方程 和 测量 方程 中 . 
其 次 , 考虑 AR 模型 , 也 就 是 说 ó(D)z = a. Aoki(1987) 介绍 了 两 种 方法 . 第 
一 种 方法 直接 定义 st = (2 pic: ,2t)', 得 到 


Zt—p+2 0 1 0 e 0 21—p4-1 0 
— 0 0 1 0 m 0 
; =i S à + | : | Ge+1, 
ees 0 0 0 1 os 0 
2t41 dp Op-1 Bp-2 * i Zt 


Ch 一 (0,0,…- ,0,1)8¢, (11.40) 
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第 二 种 方法 中 定义 状态 向 量 的 方式 与 第 一 种 方法 一 样 , 只 是 从 最 后 一 个 分 量 里 去 除 
了 at; 也 就 是 说 ,如果 p= 1, 则 si = zs 一 ax; WR p > 1, WU s = (zippi, 2-1, a- 
a). 简单 的 代数 运算 可 以 证 明 


Zt—p+2 a8 1 0 : 0 Zt-p41 0 
hid 0 0 i Gil xis 0 
; EI 4 : 4$ s 
Zi 0 0 0 1 No og 1 
241 — 04441 Pp Pp-1 Ppa - Qi Zt — ay pi 
zt = (0,0,--- ,0, 1)sr + a4. (11.41) 


a, 再 一 次 同时 出 现在 转移 方程 和 测量 方程 中 . 
下 面 考 虑 ARMA(p, q) 模型 %B)yw = 6(B)a.. 为 简便 , 不 妨 设 g > p, 引入 辅助 
变量 z, — [1/0(2)]a,, 则 有 


OB) =ar, wy =O(B)x%. 


因为 z, 是 AR(p) 模型 , 我 们 可 以 用 (11.40) RA (11.41) 式 的 转移 方程 .如 果 用 
(11.40) 式 , 我 们 可 以 利用 y, = 2(B)z 建立 如 下 测量 方程 : 


ge = [一 外 -1 一 加 2 »—9;, 1)8:, (11.42) 


EFP p> gq AS j >q WA OO; = 0. 另 一 方面 , WRH (11.41) 式 的 转移 方程 , 我 们 
可 以 建立 如 下 测量 方程 : 


yt = (—0,-1, —05—2.--- ;—04,1)8; + a4. (11.43) 


总 之 , 一 个 ARMA 模型 可 以 有 多 种 状态 空间 模型 表示 .每 种 表示 方法 都 有 
其 优 缺点 . 可 以 选择 这 些 表示 方法 中 的 任何 一 个 来 进行 估计 和 预测 ， 从 另 一 方面 
WF, (11.24) 式 和 (11.25) 式 的 状态 空间 模型 的 系数 不 随时 间 变 化 . 可 以 利用 Cayler- 
Hamilton 定理 来 证 明 观 测 y 服从 ARMA(m,m) 模型 ,其 中 的 m 是 状态 向 量 的 
维 数 . 

Ssf Pack 命令 

在 Ssf Pack/S-Plus 中 , 可 以 利用 命令 GetSsfArma 将 ARMA 模型 转化 为 状态 
空间 形式 , 所 用 方法 为 Harvey 方法 . 为 了 进一步 说 明 , 考虑 AR(1) 模型 


Ye = 0.6y 1 十 at， at ~ N(0,0.4?). 


该 模型 的 状态 空间 模型 为 
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> ssf.arl = GetSsfArma(ar=0.6,sigma=0.4) 
> ssf.arl 


$mPhi: 

Ls 1) 
{1,] 0.6 
{2,] 1.0 
$mOmega : 

[,1] [,2] 
[1,] 0.16 0 
[2,] 0.00 0 
$mSigma: 

E; 1] 
[1,] (0.25 
[2,] 0.00 


由 于 AR(1) 模型 是 平稳 的 , 程序 利用 了 Eijo = Var(y) = (0.4)?/(1 — 0.6)? = 0.25 
和 Ailo = 0, 这 些 值 出 现在 和 矩阵 mSigma E. 
作为 第 二 个 例子 , 考虑 ARIMA(2,1) 模型 


yt = 1.2y1—0.35y_2+art—0.250 1, at N(0, 1.1?). 


该 模型 的 状态 空间 形式 为 


> arma21.m = list(ar=c(1.2,-0.35),ma=c(-0.25),sigma=1.1) 
> ssf.arma21= GetSsfArma (model-arma21.m) 
> Ssf.arma2l 
smphi: 
[,1] [,2] 
[2,] 2.20 1 


[2,] -0.35 0 
[3,] 1.00 0 
$mOmeqga : 


[,1] [L2] [,3] 
[1,] 1.2100 -0.302500 0 
[2,] -0.3025 0.075625 0 
[3,] 0.0000 0.000000 0 
$mSigma: 

[,1] [,2] 

[1,] 4.060709 -1.4874057 
[2,] -1.487406 0.5730618 
(3,] 0.000000 0.0000000 


如 所 料想 , 结果 表明 


T= 1.2 1 , Z=(1,0), 
—0.35 0 


H. mPhi 和 mOmega 满足 (11.26) 式 , TE nSigma 里 用 到 了 (y, y i) 的 协 方差 矩阵 . 
注意 在 SsfPack 里 , 假定 ARMA 模型 的 MA 多 项 式 具 有 形式 0(B) = 14+6,B + 
… 十 04B9, 而 不 是 大 多 数 文 献 中 的 0(B) = 1 一 01B 一 … 一 0 万 9. 
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11.3.3 ”线性 回归 模型 
多 元 线性 回归 模型 也 可 以 表示 成 状态 空间 的 形式 . 考虑 模型 
Y= wi B+er, et~ N(0,0ż), 


其 中 a, 是 p 维 解 释 变 量 而 8 是 一 个 pb 维 的 参数 向 量 . 对 于 所 有 的 上 令 s = B. 这 
时 模型 可 以 写 为 
[| = [zz] [er]. (11.44) 


因此 ， 系统 矩阵 为 T; = Ip, Zi = Ej; d; = 0, Ct = 0, H; =0 H. Q, = 因为 状态 
向 量 是 固定 的 , 所 以 应 使 用 扩散 初始 化 方法 . 
我 们 可 以 将 回归 模型 进行 拓展 使 得 B, 为 随机 的 , BD 


Bf = B, + Rin, Jh ™ N (0, 1), 
B. Rt = (o1,--- pita A ci > 0. oy gi = 0, 则 Bi 不 随时 间 变 化 . 
Ssf Pack 命令 


在 Ssf Pack 中 , 命令 GetSsfReg 为 多 元 线性 回归 模型 创建 了 一 个 状态 空间 形 
X. 命令 有 一 个 输入 自 变量 , 包含 解释 变量 的 数据 矩阵 .为 了 进一步 说 明 , 考虑 简 
市 场 模 型 


Tt = Bo Airmat et, t=1,---+ ,168, 


其 中 r, 是 某 项 资产 的 收益 , rus 是 市 场 收 益 (例如 , S&P 500 复合 指数 收益 ). AK 
态 空间 形式 可 以 通过 如 下 命令 获得 . 


> ssf.reg=GetSsfReg(cbind(1,sp)) % ‘sp’ is market return. 
> ssf.reg 
$mPhi: 

[,1] [,2] 
(1,] 1 0 
[2,] 0 1 
[3i] 0 0 
$mOmega : 

[,1] [L,2] [,3) 
[14] 0 0 0 
(25] 0 0 0 
[3,] 0 0 1 
$mSigma: 

[,1] [,2] 
[1,1 -1 0 
{2,] 0 = 工 
13,] 0 0 
$mJPhi 
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GAF [,2] 
[1,] -1 -1 
[2,1] -1 -1 
[3,] 1 2 
Smx: 
numeric matrix: 168 rows, 2 columns. 
SP 
[1,] 1 -0.075187 


[168,] 1 0.05002 


11.3.4 带 ARMA 误差 的 线性 回归 模型 
考虑 带 有 ARMA(p, q) 误差 的 回归 模型 


Yt =T, P+ ze p(B)z =6(B)a, (11.45) 


其 中 a, ~ N(0,02) 且 a, Æ k 维 解释 变量 . 该 模型 的 一 种 特殊 情形 是 非 零 均值 的 
ARMA(p, q) 模型 , 此 时 对 于 一 切 t, wt = 1 且 B 变 成 了 纯 量 参 数 . Ws, 是 > 序 
列 的 一 个 状态 向 量 . 比如 , 如 (11.37) 式 定义 的 那样 . 我 们 可 以 定义 y, 的 状态 向 量 
8; 为 


st = bi | (11.46) 

其 中 对 于 一 切 上 有 8, = B, 这 时 y, 的 状态 空间 形式 为 
8,,1— T" si + R’m, (11.47) 
Ye = Zi sf, (11.48) 


其 中 Zi = (1,0, --- 19, @t)1x(m+k)s m = max(p, q + 1) HR. 


ci) © s R 
r-| A j - |o]: 

其 中 的 TA R 由 (11.37) 式 所 定义 . 我 们 可 以 用 如 下 紧凑 的 形式 给 出 状态 空间 
S44) [T°]. , [i 
PIMPILAINU 

Ssf Pack 命令 
对 于 带 有 ARMA 误差 的 线性 回归 模型 , Ssf Pack 利用 命令 GetSsfRegArma 建 


立 其 状态 空间 形式 . 可 以 用 命令 args(GetSsfRegArma) 找到 该 命令 的 自 变量 , 包括 
解释 变量 的 数据 矩阵 和 ARMA 模型 的 指定 . 为 了 进一步 说 明 , 考虑 模型 


Yi = Bo + Bim, + 24, t=1,--- , 168, 
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zt = 1.22,.1 — 0.35z:—-2 + a,—0.25a4-1, at~ N (0, o2). 


我 们 用 符号 X 表示 T x 2 回归 向 量 矩 阵 (1, ore). 前 述 模型 的 状态 空间 形式 可 以 通 
过 如 下 命令 得 到 


> ssf.reg.arma21=GetSsfRegArma (X,ar=c(1.2,-0.35), 
(| ma=c(-0.25)) 
> Ssf.reg.arma21 


$mPhi: 
ta) [,2] €,3) L,41 
(1,] 1.20 1 0 0 
[2,] -0.35 0 0 0 
[3,] 0.00 0 1 0 
[4,] 0.00 0 0 1 
[5,] 1.00 0 0 0 
$mOmega : 
[,1] L2] E31] [L,4] L5] 
[I3 1.00 -0.2500 0 0 0 
[2,] 20.25 0.0625 0 0 0 
[3,] 0.00 0.0000 0 0 0 
[4,] 0.00 0.0000 0 0 0 
[5,] 0.00 0.0000 0 0 0 
$mSigma: 
[,1] [,2] L,3] L,4] 
[(1,] 3.35595 -1.229260 0 0 
[2,] -1.22926 0.473604 0 0 
[3,] 0.00000 0.000000 -1 0 
[4,] 0.00000 0.000000 0 -1 
[5,] 0.00000 0.000000 o 0 
$mJPhi: 
Gar [,2] L,3] [,4] 
[1,] -1 -1 -1 -1 
[2,1 — = = -1 
t3 -1 -1 -1 -1 
[4,] -1 -1 -1 -1 
[5,] -1 -1 1 2 
$mx: 
numeric matrix: 168 rows, 2 columns. 


xt 
[1,] 1 0.4993 


[168,] 1 0.7561 
11.3.5 ” 纯 量 不 可 观测 项 模型 


最 基本 的 一 元 不 可 观测 项 模型 , 或 者 结构 时 间 序 列 模型 (structural time series 
model, STSM), 具有 形式 


Ui = He + Ye + We €t (11.49) 


其 中 py, y 和 we 分 别 表示 不 可 观测 的 趋势 项 、 季 节 项 和 循环 项 . 且 et 表示 不 可 观 
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测 的 不 规则 项 . 在 文献 中 , 通常 用 非 平稳 (可 能 带 二 重 单位 根 ) 模型 来 描述 趋势 项 


Dip pa +m, m ~ N(0,07), 
Bi Bri + St, Se ~ N(0, 02), 


其 中 pu ~ N(0,€), 有 ~ N(0,£). € 是 一 个 较 大 的 实数 , 比如 e — 108. 可 参见 , 例如 
Kitagawa and Gersch(1996). 如 果 o, = 0, 则 p 服从 带 漂移 Bl 的 随机 游 动 . 如 果 
O; — On = 0, Dill], 表 示 确 定性 的 线性 趋势 . 

假定 季节 项 o, 具有 如 下 形式 


(11.50) 


(1+ B+---+B*")y =u, w~ N(0,02), (11.51) 


其 中 s 是 一 年 中 季节 的 个 数 , 也 就 是 季节 项 的 周期 . 如 果 ou = 0, 则 季节 项 就 是 确 
定 的 . 假定 循环 项 具有 如 下 形式 


| g cos(Ac)  sin(Àe) wy 4| & (11.52) 
UL —sin(A,) cos(A.) w? el 


Et 0 2 2 
[a] ~¥ o] me. 
wo ^ N(0,02), w ~ N(0, a2), H Cov(wo, w8) = 0, 6 € (0,1] 为 阻尼 因子 , 上 且 循环 


的 频率 是 A. = 2n/q, 以 q 为 周期 . 如 果 5 — 1, 则 循环 变 成 确定 性 的 正弦 余弦 波动 . 
Ssf Pack/S-plus 命令 


利用 命令 GetSsfStsm 可 以 给 结构 时 间 序 列 模型 建立 一 个 状态 空间 形式 . 它 允 
WA 10 个 循环 项 . 可 以 参看 命令 args(GetSsfStsm) 的 输出 . 表 11-4 给 出 了 该 模 
型 自 变量 的 一 个 概要 及 其 相应 的 符号 . 为 了 进一步 说 明 , 考虑 (11.1) 式 和 (11.2) 式 
的 局 部 趋势 模型 , 这 里 令 ce = 0.4, 0, = 0.2. 该 模型 是 纯 量 不 可 观测 项 模型 的 一 个 
特例 . 可 以 通过 如 下 命令 得 到 其 状态 空间 形式 . 


> ssf.stsm=GetSsfStsm(irregular=0.4,level=0.2) 
> ssf.stsm 


SmPhi: 
[,1] 
[1,] 1 
[2,1 1 
$mOmega : 


[,1] [,2] 
[1,] 0.04 0.00 
[2,] 0.00 0.16 
$mSigma: 

[,1] 
[14] -1 
[2,] 0 
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# 11-4 SsfPack/S-plus 中 命令 GetSsfStsm 的 自 变量 


A it STSM 参数 
irregular Ge 
level On 
slope Cs 
seasonalDummy Ow,s 
seasonalTrig Cw, 
seasonalHs Ow. 
Cycle0 Oz, Ac, 6 
Cycle9 0e,Àc,Ó 


11.4 卡尔 曼 滤 波 和 和 平滑 


本 节 将 学 习 (11.24) RM (11.25) 式 中 广义 状态 空间 模型 的 卡尔 曼 滤 波 和 各 种 
平滑 方法 . 下 面 将 按照 11.1 节 里 的 步骤 给 出 推导 . 对 于 只 对 应 用 感 兴 趣 的 读者 , 初 
次 阅读 时 可 以 中 过 此 节 . 本 节 较 好 的 一 个 参考 书 是 Durbin and Koopman(2001, 第 
4 XX). 

11.4.1 卡尔 曼 滤波 

重新 回顾 一 下 卡尔 曼 滤波 的 目的 , 即 递归 地 得 到 在 给 定数 据 FP. = (uso) 
条 件 下 si 的 条 件 分 布 和 模型 . 因为 所 涉及 的 条 件 分 布 是 正 态 的 , 因此 只 要 研究 
其 条 件 均值 和 条 件 协 方差 矩阵 就 足够 了 . 令 sp MD, 分 别 表 示 给 定 F, 条 件 下 ， 
s, 的 条 件 均 值 和 条 件 协 方差 矩阵 , 也 就 是 说 sj| 玉 ~ N(8 yy, 5). 由 (11.24) 式 


Sipit = Eldi + Tis; + Rem, | Fe) = de Tisi. (11.53) 
Eei = Var(T rs: + Rim | Fi) = 了 DT + RQ, Ry. (11.54) 
与 11.1 节 相似 , 设 yu, 表示 给 定 Fia 条 件 下 ye 的 条 件 均 值 . 由 (11.25) 式 得 
Vica = Cr + Zisiea- 
ES 


Ve = Ye — Viii = Ye — (Ce + ZeSeje—1) = Ze(Se 8i) 十 et (11.55) 


是 Y: 在 给 定 Fi-i 条 件 下 的 向 前 1 步 预 测 误 差 . 很 明显 有 (a) E( v| Fi1) = 0; 
(b) v, 和 Fe- 是 独立 的 , 即 对 于 1 入 7 <t, Cov(ve, yj) = 0; (c) {ve} 是 一 列 独立 的 
正 态 随机 向 量 . 令 V, = Var(v| F1) = Var(ut) 是 向 前 1 步 预测 误差 的 协 方差 窍 
Me. 由 (11.55) 式 , 可 得 


Vi = Var[Zi(st 一 stt_i) 十 ed = ZiXqi aZ Hi. (11.56) 
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因为 及 = {F1 y} = {F,_1,™}, 应 用 定理 11.1 可 以 得 到 
stlt = E(sy| Fy) = E(si|Fi-1, vi) 
= E(s;|F1 1) 十 Cov(st v,)[Var(vi)] tv 
一 :和 tt 一 十 OV (11.57) 
其 中 C, = Cov(s;, vil F1) 由 下 式 给 出 
C, = Cov(sr, vi| Fi 1) = Cov|se, Zt(5t — stlt_1) + erl Fi] 
= Cov|s;, Zi (St = St1—1)|Fi-1] = X aZ; 
因为 A, 是 可 逆 的 , 所 以 这 里 假定 V. 是 可 逆 的 . 利用 (11.53) RA (11.57) 式 , 我 
们 得 到 
Styijt = de + Teisqia + TrCyV, ‘vp = di Tig a + Kerr, (11.58) 
其 中 
K, = T,C,V(! = TiDi- ZVT, (11.59) 
是 t 时刻 卡尔 曼 增益 . 利用 定理 11.1(2), 有 
Xj, = Var(s,|Fi-1) 
= Var(s;|F;1) — Cov(s;, v;)[Var(v,)] ' Cov(s;, ve)’ 
— Ši- V7 161 


= qa — Dyer ZV 7 Zu. (11.60) 
将 (11.60) 式 代 入 (11.54) 3X, 并 利用 (11.59) sh, 得 到 
Eua = TiDi iL + RQ, (11.61) 
其 中 
L, — T, — KZ}. 


将 上 述 方程 综合 在 一 起 , 对 于 (11.24) RA (11.25) 式 所 给 出 的 状态 空间 模型 ,我们 
得 到 其 著名 的 卡尔 曼 滤 波 . 给 定 初 始 值 s 和 Dio, 卡尔 曼 滤波 算法 为 


Ut — y, — Ce — ZeSeje-1, 
Vi= ZiIXqiaZi + Hi, 
K,—TiXquaZ;Vi., 
L,—T, — KiZi, 
854317 di Tisi + Koi, 
Biri =T Dyer RQR, t=1,---,T. 


(11.62) 
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如 果 对 滤波 量 su, 和 Dy, 也 感 兴趣 , 我 们 将 修正 滤波 使 其 同时 包含 滤波 方程 
(11.57) 式 和 (11.60) sk. 这 样 得 到 的 滤波 算法 为 
Ut — y, — Ce — Zrstlt-l; 
C, —Xq aZ, 
Vi= ZiXuaZi-- He = ZiCr + Ht, 
Stt = 8tlt—1 + CiVi ‘ve, 
Eee = Bye — CiVe Ch, 
Sirilt= di Tisi, 
Dipi T(XqT, + RQR, 
稳定 状态 
如 果 状 态 空 间 模型 不 随时 间 变 化 , 即 所 有 的 系统 矩阵 也 不 随时 间 变 化 , 则 和 矩阵 
Xa 收敛 到 常 矩 阵 D., 而 9. 是 矩阵 方程 


3j, — T9X,T' -TZV ZT + RQR', 
的 解 , 其 中 V = 2 对 .2' +H. KAA v. 后 所 得 到 的 解 称 为 卡尔 曼 滤 波 的 稳定 状 
AS AR (steady-state solution). 一 旦 达到 稳定 状态 解 ，V,, Ki 和 Xu, 就 都 是 常数 . 
这 在 计算 中 能 大 大 的 节省 时 间 . 
11.4.2 ”状态 估计 误差 和 预测 误差 
状态 预测 误差 定义 为 


Tt = 8t — Stt- 
从 上 述 定义 知 , zt AT AEA Var(zi| 及 -1) = Var(si|Ft—1) = ae 沿袭 11.1 
节 的 方法 , 我 们 可 以 推断 a, 的 性 质 . 首先 , 由 (11.55) AA 
Vt = Zi(st — Sii 1) + et = Zitti + ei. 
其 次 , 由 (11.62) 3X. (11.24) 式 以 及 前 面 的 方程 , 得 到 
TH+1= Bt+1 — St+1lt 
= Ti(st — 8141) + Rem, — Kerr 
= Tra, + Rin, — Ki(Zeee + ei) 
= Lix + Rem — Kei, 
其 中 , 和 前 面 一 样 , L, = T, 一 K: Ze 因此 , 我 们 可 以 得 到 w 的 状态 空间 形式 
ti 一 -BtDE 十 eb Ci = Leti + Rim 一 K,ei, (11.63) 
其 中 Ti = 81 — Sıjo(t = ELE SEJ 
最 后 , AUF 11.1 节 的 局 部 趋势 模型 , 我 们 得 到 向 前 1 步 预测 误差 {v4} 彼此 
相互 独立 且 lvi, eos vr] 和 Fia 相互 独立 . 
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11.4.3 ”状态 平滑 


状态 平滑 主要 讨论 给 定 Fr 条 件 下 s 的 条 件 分 布 . 值得 注意 的 是 (a) BR 
和 {v-e or} 是 独立 的 ; (b) w 是 序列 独立 的 ， 对 于 给 定 Ex 条 件 下 s， 和 
{v6,… wr} 的 联合 分 布 应 用 定理 11.1 可 以 得 到 


SuT 一 E(s;|Fr) = E(si|Fi—1;, Ut UT) 


T 
= E(si|F1-1) + X Cov(s,, vj)[Var(v;)] Tw 


j=t 


T 
= Sijt-1 + D> Cov(st, vi) V7 vi, (11.64) 


j-t 


其 中 , 协 方差 矩阵 是 给 定 Fi RE PRE AE. AF j= tT, 协 
方差 矩阵 Cov(s,, vj) 可 以 如 下 推出 . 由 (11.63) RA 


Cov(s:, vj) = E(s;v;) 
= E[s(Z;z; + e;)'] = E(s.m;))Z;, jg =t,---,T. (11.65) 
此 外 还 有 
E(s,z,) = E[se(s¢ — ss-1)] = Var(st) = Dyes, 
E( set 41) = Else(Leee + Rin, — Kee] = Bijt- Ly, 


E(s;2,,5) = Eu LL, 


"t tw] rm tn o9 


Btn) = Biya El -- Th 5. (11.66) 
将 上 面 两 个 公式 代入 (11.64) X, HF t= 7 -2,T -3,--- 1, 有 
stir = 8TIT_1 + Er T 1Z7V T vr, 
Sr-ir = 8T-ir-2 + Erir-1ZT V p. vrai Erpr iL] ,Z5V 5 vr, 
SiuT = Stjit—1 + 34-12,V4 vi T Eq aL Zi Vi vey 
TEX 1 Bi Ei, ++ Lp, ZV zp! er, 


这 里 , 4 t=T HA Li = Ly = Im. 这 些 平滑 状态 向 量 可 以 表示 为 
St|T = 3tlt 一 1  Xiiidt (11.67) 
其 中 ar, = ZV T vr, qr.3 = Zra VT awr- + Ly_,.Z;Vz7'vr A 


G1 = ZV vit Lia V gate + ot Li Dp ZpV yp vr, 
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(t — T -2,T —3,---,1). qt_1 是 发 生 在 时 刻 t 上 ~ 1 后 的 向 前 1 步 预测 误差 vj 的 加 
权 和 , 由 前 面 方程 的 定义 知 , q, 可 以 通过 下 述 向 后 递归 得 到 
1 = ZV; vet Liqe t=T, ,1, (11.68) 
其 中 gr = 0. 联 立 这 些 方程 , 我 们 得 到 平滑 状态 向 量 的 向 后 递归 
Qs i =Z Vr vt Lids syr = Si- Die- t=T,---.1, (11.69) 
该 递归 从 qr = 0 开始 , 而 且 Siti, 如 4_1, Le 和 Ve 可 通过 卡尔 曼 滤波 得 到 . 在 


相关 文献 里 这 就 是 固定 区 间 平 消 (fixed interal smoother). 参见 de Jong(1989) 和 其 
中 的 参考 文献 . 


平滑 状态 向 量 的 协 方差 矩阵 
下 面 , 我 们 将 推导 出 平滑 状态 向 量 的 协 方差 矩阵 . 对 于 给 定 Fii 条 件 下 s, 和 
{vn vr} 的 条 件 联合 分 布 应 用 定理 11.1(4), 得 到 


1 
Bar = Di — Y > Cov(sp, v;)[Var(v;)] "! [Cov(s;, v;)]'. 


j=t 
由 (11.65) 式 和 (11.66) 式 里 的 协 方差 矩阵 , 进一步 可 得 到 
Bar = Dyer — Dyrr ZV, ZiB- 一 Doe Zi Wig Zep LtEtt 
essc Sia iic Eb. MV E ED 
= Xu — Xia MicaXqoa, 


Mi = ZV Zi LZ aV nh Zep Lt 
feeb Te Bh AZLVIUEBE a. 
5 t=T 时 仍然 有 L; --- Lr- —Im. 由 该 定义 矩阵 Mı 满足 


Mi = DVD MLD, t=T -= Í, (11.70) 
且 初 值 为 My = 0. 综合 前 面 的 结果 , 我 们 得 到 计算 Dy 的 向 后 递归 公式 
Mı- = Zi Vi Zi + DML, Ear = Bai— DoiMe Du, (11.71) 


HP t=T,- ,1 且 Mr =0. 注意 正如 11.1 节 里 的 局 部 趋势 模型 Mr = Var(q,). 
联合 上 面 平滑 状态 向 量 的 两 个 向 后 递归 公式 , 我 们 有 
Qi .1 = Zi Vi vt + Lig, 
Sit]T = Stjt-1 + Eid: 
M,4—Z,V, Zi t LI Mi, 
Biar = Yt- — Eee- Mt- t—T,,1, 


(11.72) 
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trp qr = 0 A My =0. 

假定 (11.24) 式 和 (11.25) 式 里 的 状态 空间 模型 已 知 , 则 卡尔 曼 滤波 和 状态 平 
滑 可 以 通过 两 步 运算 得 到 . 首先 , 对 于 + 一 1,… ,T, 使 用 (11.62) 式 里 的 卡尔 曼 滤 
波 并 获得 量 vi, Vi, Ke, 8-1 和 Doe 其 次 , WF t=T,- ;1, 应 用 (11.72) 式 
的 状态 平滑 法 得 到 sur 和 Eir- 
11.4.4 ”扰动 平滑 


令 enr = E(ei|Fr) 和 mr = Elm Fr) 分 别 表示 观测 方程 和 转移 方程 的 平滑 
扰动 . 这 些 平滑 扰动 (smoothed disturbances) 在 许多 应 用 领域 (比如 在 模型 检验 中 ) 
都 很 有 用 . 在 本 小 节 , 我 们 将 学 习 计 算 平滑 扰动 及 其 协 方差 扎 阵 的 递归 算法 .再 次 
对 于 给 定 Fa 条 件 下 m [vi 0r} 的 条 件 联合 分 布 应 用 定理 11.1, 得 到 

T 


ear = E(eiFi i vin: , vr) = >》 E(ev)V;v;. (11.73) 


j=t 
这 里 用 到 了 E(e,| F 1) = 0. 利用 (11.63) RA 

E(eiv;) = E(erw})Z', + E(ere’). 
由 于 E(e;x!) = f). 从 而 有 


Elew’) = l er alu M * (11.74) 
反复 应 用 (11.63) 式 以 及 {e} Al {n} 之 间 的 独立 性 , 我 们 得 到 
E(etztHi) = —H.K,, 
El(etzt+2) = -HiK Lipi 
E(ew) = -H,K,L,,1-7 Dp, (11.75) 
HPH t=T-1 时 , 有 Liye Lra = Im. 基于 (11.74) AM (11.75) R, 得 到 
eyr = Hi(Vi vi - KZ Vite eee K, Liy + bp_, ZV z' vr) 
= H,(V;'%— Kiq) = Hioj, t =T,---,1, (11.76) 


其 中 qg, 由 (11.67) SE XH. o, = V;!v, — K'a. RINK o, 称 为 平滑 测量 误 
# (smoothing measurement error). 


平滑 扰动 myr 可 用 类 似 的 方式 推导 出 , 即 


T 
TT 一 Y E(mnv)V;!v;. (11.77) 


j=t 
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(11.67) 式 的 状态 空间 模型 给 出 


QRZ, 着 于 = 二 il 


E(n,v’.) = 
i: i) | E(r,75)Z;, 4 j=t+2,--- sd 


其 中 , 对 于 t= 1;…,T, 有 


E(m2t42) = QR Lipi» 
E(n,z 3) 一 QR Iiis 


E(n,z5) = QR Lii t Lp 4 
因此 , (11.77) 式 意味 着 
mir = Q Ril Zia V oa rer + Li ZusVestua 
Tc ? SS oL Qa ZTVT vr) 


=Q; Riq t—T,--.,1, (11.78) 


其 中 g, 由 先前 的 (11.68) 式 所 定义 . 
Koopman(1993) 利用 平滑 扰动 Un 推导 出 一 个 计算 sar 的 新 的 递归 方法 . 由 
(11.24) 式 的 转移 方程 , 有 


S17 = d, + TistT Fan. 
利用 (11.78) 式 可 得 
8, | ir 一 d, T T.sur 十 R,Q, Ria. t 一 T. Puis I. (11.79) 


其 中 初始 值 为 sir = silo 十 2ilogo 且 qo 从 (11.68) 式 的 递归 方程 中 得 到 | 
平滑 扰动 的 协 方差 矩阵 
平滑 扰动 的 协 方差 矩阵 同样 也 可 以 通过 定理 11.1 得 到 , 具体 地 
Var(e;| Fy) = Var(e,| F, 1, vz, one vr) 


T 
= Var(e;| Fi 1) — >. Cov(er, v;)V ; [Cov(er, v;)]'. 


j—^t 
注意 (11.74) 式 给 出 Cov(e;, vj) = E(e,v*), 因此 我 们 有 


Var(et|Fr) = H, — Hi(Vir + KZ Voi Zi Kt 
+ KL ZV goZ LK 
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eB KLDLq-cLbBaAZLTZrLpac L141K1) Mt 
= H; = + KIMK.)H, 
一 一 H, — H,NH,, 


其 中 N,—V;,!-- Ki M,K,, 这 里 的 M, 由 (11.70) RAH. 类 似 地 


T 
Var(ņ,|Fr) = Var(n,) — $ Cov(m, ve) Ve [Cov(m, vo), 


j= 
其 中 Cov(n,, vj) = Emut) 在 推导 mr 的 公式 时 已 经 给 出 . 因此 


Var(y,|Fr) = Q, — QR (Za V ai Ze + Diy ZusVisZiuasbiua 
tet Diy Lp ZV r ZrbraccLua)RQQ, 
=Q,- Q, R,M.R,Q,. 
总 之 , 扰动 平滑 算法 如 下 


eyr=H,(V; v, — Kiq), 
Nyr=Q, Ria, 
d. | TALE + Lidi 
Var(e,|Fr) =H, — H,(V;! + KK M,K,)H,, 
Var(n,|Fr) - Q, - Q,RLM.R4Q,. 
Mii DV MD. t= ,1, 


其 中 qr =0 H. My = 0. 


(11.80) 


11.5 # 4 dü 


对 于 (11.24) 式 和 (11.25) 式 中 的 广义 状态 空间 模型 , 我 们 考虑 缺失 值 的 两 种 
形式 . 首先 , 类 似 于 11.1 节 中 的 局 部 趋势 模型 , 假设 在 时 刻 二 = £21, +h EE 
观测 值 y, 是 缺失 的 . 此 种 情况 下 , 在 这 些 时 间 点 上 , 没有 新 的 信息 , 我 们 令 


v;—0, K,=0, for t=é@+1,-::,€+h. 
这 时 和 平常 一 样 就 可 以 运用 (11.62) 式 中 的 卡尔 曼 滤 波 . 也 就 是 
Si+1lt = di Tisi Eia = TiXq aT, + RQ, R,, 


XE t—f +1,--- +h. 类 似 地 , 对 于 + 上 三 5 十 1…. Ah FERRA ID RE B RT DL 
往常 一 样 通过 (11.72) 式 计 算 如 下 


q,;-—T7Tiq, TO 
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在 第 二 种 情形 , y, 部 分 缺失 . B y; = Ju, 为 上 时 刻 所 观测 到 的 数据 向 量 , 这 里 
J 为 识别 观测 数据 的 指示 年 阵 . 更 具体 地 讲 , J 的 行 是 大 x k 单位 矩阵 的 子 集 , 此 
时 , 模型 的 观测 方程 (11.25) 式 可 以 转换 为 


yt =C + Zis + ef, 


EP cf = Je, ZI = IZ, 和 e; = Jer, 有 日 协 方差 矩阵 Var(e?) = Hz = JH. K 
了 时 刻 t 使 用 修正 的 观测 方程 外 , 可 以 继续 应 用 卡尔 曼 滤 波 和 状态 平滑 递归 . 因此 ， 
状态 空间 模型 的 一 个 好 的 特点 就 是 便于 处 理 缺失 值 . 


11.6 预 测 


假定 预测 原点 是 上 且 我 们 关注 y,,; 的 预测 值 , 7 = 1,---,h, h > 0. 我 们 仍然 
采用 最 小 均 方 误差 预测 . 类 似 于 ARMA 模型 , 向 前 j 步 预测 误差 y) 就 是 给 定 
条 件 下 y,;; 的 条 件 期 望 值 . 也 就 是 说 , y,(j) = Elyn Fe) 下 面 , 我 们 将 证 明 这 
些 预 测 和 相应 的 预测 误差 的 方差 可 以 通过 (11.62) 式 中 的 卡尔 曼 滤波 得 到 , 只 是 此 
时 将 (giis ten} 看 作 缺 失 值 , 这 正 是 11.5 节 的 第 一 种 情形 . 

考虑 向 前 1 步 预测 误差 . 由 (11.25) 式 


Wi = E(y, 1| Fi) = cepa + Zitiserilt, 
其 中 sepie 可 以 通过 预测 原点 为 t+ 时 刻 的 卡尔 曼 滤 波 得 到 . 相应 的 预测 误差 为 
et(1) = Yiyi — (1) = Ztt1(8t+1 — Sia) + etp- 
因此 , 向 前 1 步 预测 误差 的 协 方差 矩阵 为 
二 2 和 


这 正 是 (11.62) 式 中 卡尔 曼 滤波 的 协 方差 矩阵 Vix, 于 是 , 我 们 证 明了 h = 1 的 情 
JE. 对 于 h > 1, 我 们 按 顺 序 考虑 1 步 到 h 步 的 向 前 预测 . 由 (11.25) 式 , 向 前 了 步 
预测 为 

y) = ejt Zijsisge (11.81) 


且 相 应 的 预测 误差 是 
elj) = Z 145 (S84; = S44 5\t) T etj- 


值得 注意 的 是 , seje 和 Xs 分 别 是 给 定 也 条 件 下 soos 的 条 件 均值 和 条 件 协 方 
差 矩 阵 ， 上 式 说 明 
Varlei()] = 2e4+j Ber je Zt45 Hu. (11.82) 
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进一步 , 由 (11.24) 式 
Styjtijt = dicj + Toicjscje 
这 反 过 来 意味 着 
Sij — St 一 Tecg(8i — 8e) + Regn; 
因此 
Xa = Tij Ver je Tiry + Ro GjQu,4 Rr (11.83) 

值得 注意 的 是 , Var[ei(j)]) = Vex, AF t 49, j = Lh. (11.81)~(11.83) 
式 是 由 (11.62) 式 给 出 的 卡尔 曼 滤 波 的 递归 公式 , 且 此 时 vj = 0, Kej = 0. Al 
此 , 预测 值 y, (7) 和 其 预测 误差 e (7) 的 协 方差 矩阵 都 可 以 通过 带 有 缺失 值 的 上 尔 
曼 滤 波 得 到 ， 

最 后 , 可 以 利用 误差 预测 序列 {vi} 来 计算 估计 时 用 到 的 似 然 函数 且 标准 化 的 
误差 预测 Di 人 /vi 可 以 用 米 进行 模型 检验 , 这 里 D, = diag{fVi(l 1), , Welk. k)] 
H Vi (i, i) 是 V: 的 第 (4,2) 个 元 素 . 


11.7 A 用 


在 本 节 中 , 我 们 考虑 状态 空间 模型 在 金融 和 商业 中 的 一 些 应 用 . 我 们 的 目标 是 
突出 模型 的 应 用 且 演 示 S-Plus 中 用 Ss f Pack 进行 分 析 的 实际 操作 . 
例 11.2 ”考虑 General Motors(GM) 股票 从 1990 年 1 月 到 2003 4E 12 月 的 月 简 
单 超额 收益 率 的 CAPM. 参见 第 9 章 . 我 们 将 S&P 500 复合 指数 的 月 简单 超额 收 
益 率 作为 市 场 收 益 率 . 我 们 从 简单 市 场 模型 开始 


T, — Y fÜrwaces ec N(0, a?) (11.84) 


L— 1,+++ ,168. 这 是 一 个 确定 系数 的 模型 , 很 容易 通过 普通 最 小 二 乘 方法 (OLS) 来 
估计 . 分 别 用 gn 和 sp 来 表示 GM 股票 收益 和 市 场 收 益 , 结果 如 下 给 出 . 


> fit=OLS (gm~sp) 
> summary (fit) 


Call: 
OLS (formula = gm ~ sp) 
Coefficients: 
Value Std. Error t value Pr(»|t|) 
(Intercept) 0.0020 0.0063 0.3151 0.7531 
sp 1.0457 0.1453 7.1964 0.0000 


Regression Diagnostics: 
R-Squared 0.238 

Adjusted R-Squared 0.233 

Durbin-Watson Stat 2.029 


Residual Diagnostics: 
Stat P-Value 
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Jarque-Bera 2.537 0.281 
Ljung-Box 24.207 0.337 


Residual standard error: 0.0813 


因此 , 所 拟 合 的 模型 为 
re = 0.02 + 1.045 Trmt+e Ĉe = 0.081 3. 


基于 残 差 诊断 , 模型 对 于 GM 股票 的 收益 似乎 是 充分 的 且 有 修正 后 的 R? = 23.3%. 
正如 11.3 节 , 模型 (11.84) 式 是 状态 空间 模型 的 一 个 特例 . 我 们 利用 Ss f Pack 
来 估计 该 模型 . 结果 如 下 : 


reg.m=function (parm, mX=NULL) { 

parm=exp (parm) $ log(sigma.e) used to ensure positiveness. 
ssf.reg-GetSsfReg(mX) 
ssf.reg$mOmega [1,3] -parm[i] 

CheckSsf (ssf.req) 

) 

c.start-c(0.1) 
reg.fit-SsfFit(c.start,gm,""reg.m",mX-X.mtx) 
RELATIVE FUNCTION CONVERGENCE 

» Sqrt(exp(reg.fit$parameters)) 

[1] 0.08129934 


VV +e eee 


% Next, perform smoothing 
> ssf.reg$mOmega[3,3]-exp(reg.fit$parameters) 
> reg.s=SsfMomentEst (gm, ssf.reg, task="STSMO") 
> reg.s$state.moment [10,] * use 10th row to avoid impact 
state.1 state.2 % of the starting value. 

[10,] 0.001985928 1.045712 
& Next, obtain standard errors of estimates 

> Sqrt(reg.s$state.variance[10,]) 

state.1 state.2 
0.006301927 0.1453096 


如 所 料想 , 整体 上 该 结果 和 OLS 7735 rf i St. 

最 后 , 我 们 采用 11.3.1 节 的 时 变 CAPM. 下 面 给 出 了 估计 的 结果 , 包括 平滑 响 
应 变量 的 时 间 图 ， 利 用 命令 SsfCondDens 计算 状态 向 量 和 观测 的 不 带 方 差 估 计 的 
平滑 估计 . 


tv.capm = function(parm,mX-NULL)( % Setup the model 
parm=exp (parm)  *parameterize in log for positiveness. 
Phi.t = rbind(diag(2),rep(0,2)) 

Omega=diag (parm) 

JPhi=matrix(-1,3,2) 

JPhi[3,1]-1 

JPhi [3,2] =2 

Sigma=-Phi.t 

ssf.tv=list (mPhi=Phi.t, 

mOmega=Omega, 


二 十 十 十 十 十 十 二 +v 
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+ mJPhi=JPhi, 
+ mSigma=Sigma， 
+ mX=mX) 
+ CheckSsf (ssf.tv) 
+ 
> tv.start=c (0,0,0) starting values 
> tv.mle=SsfFit (tv.start,gm, "tv.capm",mX=X.mtx) *testimation 
> sigma.mle=sqrt (exp (tv.mle$parameters) ) 
> sigma.mle 
1.168806e-05 0.0007428207 0.08129916 
% Smoothing 
> smoEst.tv-SsfCondDens (qm,tv.capm(tv.mleSparameters, 
+ mX=X.mtx) , task="STSMO") 
> names (smoEst .tv) 
[1] "state" "response" "task" 
> par(mfcol=c(2,2)) S$plotting 
> plot (gm,type='1',ylab=’excess return') 
> title(main=' (a) Monthly simple excess returns’ ) 
> plot(smoEst.tv$response,type-'l',ylab-'rtn') 
> title(main-'(b) Expected returns’ ) 
> plot (smoEst.tv$state[,1],type='1’',ylab=’ value’ ) 
> title(main-'(c) Alpha(t)') 
> plot (smoEst.tv$state[,2],type='1’,ylab=’value’ ) 
> title(main-' (d) Beta(t)’) 


注意 , cy 和 os 分 别 为 1.17 x 10 和 0.74 x 1073. 这 些 估 计 和 0 非常 接近 , 表明 
对 于 GM 股票 的 收益 率 而 言 时 变 市 场 模型 中 的 a, 和 本 质 上 是 常数 ， 这 与 确 
定 系 数 的 市 场 模型 能 很 好 地 拟 合 数据 这 个 事实 是 一 致 的 . 图 11-5 给 出 了 有 关 时 变 
CAPM 的 一 些 图 . (a) 是 从 1990 年 1 月 到 2003 年 12 月 的 GM 股票 月 简单 超额 收 
益 率 的 时 间 图 . (b) 是 GM 股票 的 期 望 收益 , 即 rar, 其 中 了 = 168 是 样本 容量 . (c) 
和 (d) 分 别 是 se 和 GB, 估计 的 时 间 图 . 对 于 给 定 的 刻度 紧密 的 纵 轴 , 这 两 个 时 间 
均 证 实 了 确定 系数 的 市 场 模型 对 于 GM 股票 的 月 收益 率 是 充分 的 . 
例 11.3 在 本 例 中 , 我 们 利用 不 可 观测 的 成 分 模型 重新 分 析 Johnson 股票 的 季度 
收益 序列 , 时 间 区 间 是 从 1960 年 到 1980 年 ， 数据 的 细节 参见 第 2 章 . 考虑 的 模 
型 为 

Ye = pm +n +e ee~ N(0,02), (11.85) 


其 中 y, 是 观测 到 的 每 股 收益 的 对 数 , ww 为 局 部 趋势 项 上 且 满 足 
hiyi = e+ me, me ~ IN (0,07). 
H 是 季节 项 上 且 满 足 
(1+B+B? - By =u, w~ N(0,02), 


也 就 是 说 y = — mj cui. 此 模型 有 三 个 参数 re, my 和 ou. 这 是 一 个 简单 的 
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不 可 观测 成 分 模型 . 该 模型 的 状态 空间 形式 为 


[rn LG U 9 Ht 1 0 

Yt+i m =f = =l Yi x o 1 mI, 
^t D 41 0 = 0 0 Wt 

dj u g i WF Yt-2 0 0 


其 中 , (m we)! 的 协 方差 矩阵 是 {opah H w = [1,1,0,0]5 +e. 参见 11.3 节 . 其 
实 这 是 Ss f Pack 中 结构 时 间 序 列 的 特例 且 很 容易 利用 命令 GetSsfStsm 给 出 . 进行 
最 大 似 然 估计 , 我 们 得 到 (6., oy, õu) = (0.014 3, 0.269 6, 0.171 2). 


(a) (c) 


0.2 
W* 01 
E4-| in gu 0,001 99 
E 车 
ud —D.2 0.001 99 
ü 50 ]00 150 0 AO 100 150 
(h) (d) 
1.045 80 mt 
0.05 
s = 1.045 70 
一 0.05 
1.045 60 


一 0.15 
0 50 100 150 0 50 100 150 


11-5 将 时 变 CAPM 应 用 于 GM 股票 的 月 简单 超额 收益 率 时 一 些 统计 量 的 时 间 图 . S&P 
500 复合 指数 的 月 简单 超额 收益 率 作为 市 场 收 益 率 : (a) 月 简单 超额 收益 率 ; (b) 超 
额 收益 rar: (c) ce 的 估计 ; (d) 的 估计 


jnj=scan(file='q-jnj.txt’) 

y-1og(jnj) 

Estimation 

jnj.m-function (parm) { 

parm=exp (parm) 
jnj.sea-GetSsfStsm(irregular-parm[1],level-parm[2], 
seasonalDummy=c (parm[3] ,4)) 

CheckSsf (jnj.sea) 


V Td +e + + vvv 


> c.start=c (0,0,0) % Starting values 

» jnj.est-SsfFit(c.start,y,"jnj.m") 

> names (jnj .est) 
[1] "parameters" "objective" "message" "grad.norm" 
[5] "iterations" "f.evals" "g.evals" "hessian" 
[9] "scale" "aux" "call* 


11.7 & 


» jnjest-sqrt (exp(jnj.est$parameters)) 

» jnjest 

[1] 0.001429867 0.269622976 0.171221806 % Estimates 

* Next, specify the model with estimates 

> jnj.ssf-GetSsfStsm(irregular-jnjest [1] ,level=jnjest [2], 
+ seasonalDummy=c (jnjest [3] ,4)) 

> CheckSsf(jnj.ssf] 


$mPhi: 

La) L2] L3] GA 
[1,] i 0 0 0 
(2,1 0 21 =i -1 
(3,] 0 1 0 0 
[4,] 0 0 1 0 
[5,] 1 1 0 0 
$mOmega : 

[,1] [,2] [,3] [,4] L,5] 

[1,] 0.07270 0.00000 0 0 0 
[2,] 0.00000 0.02932 0 0 0 
[3,] 0.00000 0.00000 0 0 0 
[4,] 0.00000 0.00000 0 0 0 
[5,] 0.00000 0.00000 0 0 2.044e-06 
$mSigma: 

ba) GA L,3] [4] 
P -1 0 0 0 
[2,] 0 -1 0 0 
[3,] 0 0 -1 0 
[4,] 0 0 0 AI 
(5, ] 0 0 0 0 
$mDelta: 

is 
i 0 
[2,] 0 
[3,] 0 
[4,] 0 
[5,] 0 
SmJPhi 
[1] 0 
$mJOmega 
[1] 0 
$mJDelta 
aa 0 
SmX: 
[1] 0 
ScT: 
[1] 0 
$cX: 
{1] 0 
$cY: 
[1] 1 


m 
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[1] 4 
attr(, "class"): 
[1] "ssf" *below: smoothed components 


> jnj.smo-SsfMomentEst (y, jnj.ssf,task-"STSMO") 
upl-jnj.smo$state.moment[,1] + 
2*sqrt (jnj.smo$state.variance[,1]) 
lwi-jnj.smo$state.moment[,1] - 
2*sqrt(jnj.smo$state.variance[,1]) 
> max(upl) t%obtain range for plotting 
[1] 3.067664 
> min(1wl) 
[1] -1.063997 
> up-jnj.smo$state.moment[,2] + 
+ 2*sqrt(jnj.smo$state.variance[,2]) 
> lw=jnj.smo$state.moment[,2] - 
+ 2*sqrt(jnj.smo$state.variance[,2]) 
> max (up) 
[1] 0.5909587 
> min (lw) 
[1] -0.6157968 
par (mfcol=c(2,1)) *plotting 
plot(tdx,jnj.smo$state.moment[,1],type-'l',xlab-'year', 
ylab-'value',ylim-c(-1.1,3.1)) 
lines (tdx,up1,lty-2) 
lines (tdx,lw1,1ty-2) 
title(main-'(a) Trend component’ ) 
plot (tdx,jnj.smo$state.moment[,2],type-'l',xlab-'year', 
ylab='value’ ,ylim=c(-.62,0.6)) - 
lines (tdx, up, lty=2) 
lines (tdx, lw, lty-=2) 
title(main-' (b) Seasonal component’ ) 
Filtering and smoothing 


jnj .fil=KalmanFil ly, jnj.ssf,task="STFIL") 
jnj.smo-KalmanSmo!jnj.fil,jnj.ssf) 

plot(tdx,jnj.fil$mOut[,1],type-'l',xlab-'year', 
ylab-'resi') 

title (main=' (a) 1-Step forecast error’) 

plot (tdx, jnj .smoSresponse.residuals [2:85] ,type='1', 

xlah=' year’ ,ylab='resi’) 

title(main-'(b) Smoothing residual’) 


图 11-6 给 出 了 趋势 项 和 季节 项 的 平滑 估计 , 即 eT 和 "T HT-—8. 令 人 感 
兴趣 的 是 季节 项 似乎 随时 间 变 化 . 图 中 还 给 出 了 不 可 观测 项 的 置信 水 平 为 95% 的 
逐 点 置信 区 间 , 图 11-7 给 出 了 残 差 图 . 其 中 (a) 给 出 了 利用 卡尔 曼 滤 波 计算 的 向 
前 1 步 预 测 误差 而 (b) 为 拟 合 模型 的 平滑 响应 残 差 . 因此 状态 空间 模型 给 出 了 另 
外 一 种 选择 来 分 析 季 节 时 间 序 列 ， 必须 说 明 的 是 图 11-6 给 出 的 估计 项 并 不 是 唯一 
的 . 它们 依赖 于 指定 的 模型 和 选用 的 参数 . 实际 上 , 将 可 观测 时 间 序 列 分 解 成 不 可 
观测 项 的 方法 有 很 多 . 例如 , 对 于 季节 项 可 以 指定 不 同 的 模型 , 比如 , 利用 Ss f Pack 
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中 的 seasonalTrig 来 得 到 Johnson 和 Johnson 公司 收益 序列 的 男 一 种 分 解 . 因此 ， 
在 解释 被 估 项 时 要 特别 的 小 心 . 然而 , 如 果 出 于 预测 的 目的 , 只 要 选择 的 分 解 方式 
正确 , 对 于 分 解 方式 的 选择 并 不 重要 . 


(a) 
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= j 
- D 
Em "1 
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(b) 
0.6 
zi 0.2 
$ 02 


6 | 
1960 1065 "S 1975 1980 


11-6 ”给 Johnson 股票 的 对 数 季度 收益 序列 所 拟 合 模型 (11.85) 式 的 平滑 项 , 时 间 区 间 是 
从 1960 年 到 1980 年 : (a) 趋势 项 ; (b) 季节 项 . 点 线 为 置信 水 平 为 95 色 的 逐 点 置 
信 区 间 


(a) 向 前 1 步 预测 误差 


0. 
Aj 0.1 
R or 


1060 1965 1970 1975 1980 
(b) 平滑 残 差 
0.5 
z -0.5 
-15 
1960 1965 1970 1975 1980 
年 


图 11-7 ”给 Johnson 股票 的 对 数 季度 收益 序列 所 拟 合 模型 (11.85) 式 的 残 差 序列 : (a) 向 前 
1 步 预测 误差 ve (b) 响应 变量 的 平滑 残 差 


练 2] 题 


11.1 考虑 ARMA(1,1) 模型 jy 一 0.8y-_1 = 二 a 十 0.4at-1, 其 中 ae ~ N(0,0.49) 的 . 分 别 利用 
(a) Akaike 方法 ; (b) Harvey 方法 ; (c) Aoki 方法 将 该 模型 转化 成 状态 空间 形式 . 
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11.2 


11.3 


11.4 


11.5 


文件 aa-rv-20m.txt 包含 了 Alcoa 股票 收益 序列 从 2003 年 1 月 2 日 到 2007 年 5 月 7 

日 的 日 已 实现 波动 率 . 参见 11.1 节 的 例子 . 波动 率 序列 由 每 日 内 间隔 20 分 钟 的 对 数 收益 

计算 . 

(a) 给 对 数 波 动 率 序列 拟 合 一 个 ARMA(0,1,1) 模型 并 写 出 该 模型 . 

(b) 对 于 对 数 波动 率 序列 估计 (11.1) 式 和 (11.2) 式 的 局 部 趋势 模型 . 参数 ce 和 o 的 
估计 是 什么 ? 给 出 滤波 和 平滑 状态 变量 的 时 间 图 和 省 信 水 半 为 9576 85388 a BI fis DX [8] 
图 . 

考虑 Pfizer 股票 和 S&P 500 复合 指数 的 月 简单 超额 收益 率 , 时 间 区 间 是 从 1990 年 1 月 

到 2003 年 12 H. 超额 收益 率 包含 在 文件 m-pfesp-ex9003.txt 中 , 且 第 一 列 为 Pfizcr 

股票 收益 率 . 

(a) 给 Pfizer 股票 收益 率 拟 合 一 个 确定 系数 的 市 场 模型 并 写 出 该 模型 . 

(b) 给 Pfizer 股票 收益 拟 合 一 个 时 变 的 CAPM. ae A Aa 序列 中 新 息 的 被 估 标 准 误差 是 
多 少 ? 给 出 o, 和 应 的 平滑 估计 的 时 间 图 . 

考虑 AR(3) 模型 


re 一 办 Tt 1 十 加 Xi-2 十 msZt-3 十 at ar ~ IN(O, 04); 


且 假 设 观 测 数据 是 
Ye—Merer, Bt N(0, 02), 


其 中 {et} 和 {ae} 独立 且 zili « 0) 的 初始 值 和 elt > 0) 与 alt > 0) 是 独立 的 . 

(a) 将 该 模型 转化 成 状态 空间 形式 . 

(b) 如 果 E(e,) =c, 且 不 为 0, 则 系统 相应 的 状态 空间 形式 是 什么 ? 

文件 m-ppiaco.txt 包含 了 年 , A, 日 和 U.S. 制造 业 价格 指数 (PPI), 时 间 区 间 是 从 1947 

年 1 月 到 2004 年 的 8 月 .该 指数 针对 所 有 的 日 用 品 且 没 有 经 过 季节 调整 ， 设 zt = 

In(Z4) — In(Z,i), 其 中 Z, 是 观测 到 的 月 PPL 如 果 忽 略 极 小 的 季节 依赖 性 , 则 AR(3) 

模型 对 于 y 似乎 是 充分 的 . 令 y. 表示 样本 均值 修正 后 的 z 序列 ， 

(a) 给 y 拟 合 一 个 AR(3) 模型 并 写 出 该 模型 . 

(b) 假设 y. 有 独立 的 测量 误差 且 yt = Et + er, 其 中 zi 是 一 个 AR(3) LEA Var(er) = 
a2. 利用 状态 空间 形式 去 估计 参数 , 包括 状态 新 息 的 方差 和 o2. 写 出 拟 合 的 异型 并 
给 出 are 平滑 估计 的 时 间 图 . 另外 , 给 出 所 拟 合 状态 空间 模型 的 滤波 反应 残 差 的 时 间 
图 . 


参考 文献 


Akaike, H. (1975). Markovian representation of stochastic processes by canonical variables. SIAM 


Journal on Control 13: 162-173. 


Aoki, M. (1987). State Space Modeling of Time Series. Spinger-Verlag, New York. 
Anderson, B. D. O. and Moore, J. B. (1979). Optimal Filtering. Prentice Hall, Englewood Clitts, 


NJ. 


Chan, N. H. (2002). Time Series: Applications to Finance. Wiley, Hoboken, NJ, 
de Jong, P. (1989). Smoothing and interpolation with the state space model. Journal of the 


American Statistical Association 84: 1085-1088. 


参考 文献 471 


Durbin, J. and Koopman, S. J. (2001). Time Series Analysis by State Space Methods. Oxford 
University Press, Oxford, UK. 

Hamilton, J. (1994). Time Series Analysis. Princeton University Press, Princeton, NJ. 

Harvey, A. C. (1993). Time Series Models, 2nd edition. Harvester Wheatsheaf, Hemel Hempstead, 
UK. 

Kalman, R. E. (1960). A new approach to linear filtering and prediction problems. Journal of 
Basic Engineering, Transactions ASMA Series D 82: 35-45. 

Kim, C. J. and Nelson, C. R. (1999). State Space Models with Regime Switching. Academic Press, 
New York. 

Kitagawa, G. and Gersch, W. (1996). Smoothness Priors Analysis of Time Series. Springer- 
Verlag, New York. 

Koopman, S. J. (1993). Disturbance smoother for state space models. Biometrika 80: 117-1206. 

Koopman, 5. J., Shephard, N. and Doornik, J. A. (1999). Statistical algorithms for models in state- 
space form using SsfPack 2.2. Econometrics Journal 2: 113-166. Also, http: //www.ssfpack. 
com/. 

Shumway, R. H. and Stoffer, D. S. (2000). Time Series Analysis and Its Applications. Springer- 
Verlag, New York. 

West, M. and Harrison, J. (1997). Bayesian Forecasting and Dynamic Models, 2nd edition. 
Springer- Verlag, New York. 
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计算 工具 与 计算 方法 的 进步 已 经 大 大 地 增强 了 我 们 解决 复杂 问题 的 能 力 ， 这 
种 进步 也 扩展 了 许多 已 有 计量 经 济 方法 和 统计 方法 的 应 用 .统计 中 这 种 进步 的 例 
子 包 括 马尔 可 夫 链 蒙特 卡 罗 方 法 (MCMC) 和 数据 扩展 . 有 了 这 些 方法 , 我 们 便 能 够 
进行 一 些 几 年 前 还 不 可 行 的 统计 推断 ， 本 章 引 进 了 金融 中 广泛 使 用 的 MCMC 方 
法 和 数据 扩张 的 思想 . 特别 地 , 我 们 讨论 经 由 Gibbs 抽样 的 贝 叶 斯 推断 , 并 演示 了 
MCMC 方法 的 各 种 应 用 . MCMC 方法 论 的 迅速 发 展 不 可 能 涵盖 所 有 在 文献 中 出 
现 的 新 方法 ， 感 兴趣 的 读者 可 以 参考 一 些 近期 的 关于 贝 叶 斯 统计 和 实证 贝 叶 斯 统 
计 的 书 (例如 Carlin and Louis, 2000; Gelman, Carlin, Stern and Rubin, 2003). 

对 于 应 用 , 我 们 把 注意 力 放 在 与 金融 计量 经 济 学 有 关 的 问题 上 . 本 章 中 所 表述 
的 仅仅 是 此 方法 在 金融 中 所 有 可 能 应 用 中 的 一 小 部 分 . 事实 上 , 公正 地 说 , 我 们 这 
里 讨论 的 贝 叶 斯 推断 和 MCMC 方法 在 金融 计量 经 济 学 的 大 多 数 研究 (如 果 不 是 全 
部 的 话 ) 中 , 都 是 切实 可 行 的 . 

首先 回顾 一 下 马尔 可 夫 过 程 (Markov process) 的 概念 . 考虑 一 个 随机 过 程 {Xe}, 
这 里 假定 每 个 X, 都 在 空间 e 上 取 值 . KIE {X} 是 一 个 马尔 可 夫 过 程 , 如 果 它 
具有 性 质 : 给 定 X 的 值 , Xlh > t) 的 值 不 依赖 于 Xs(s < t) 的 取 值 . 换 句 话说 , 称 
{Xi} 是 一 个 马尔 可 夫 过 程 , 如 果 它 的 条 件 分 布 函数 满足 


P(Xp|Xe,8<t) = P(Xn|Xt), ht. 
如 果 (X,) 是 一 个 离散 时 间 的 随机 过 程 , 则 前 面 的 性 质变 为 
P(Xn| Xe, Xii) = P(AnlX), ht. 
4 A 表示 @ NFR, 则 函数 
P,(0,h, A) = P(X, € AJX«—0), h»t 


称 为 马尔 可 夫 过 程 的 转移 概率 函数 . 如 果 转 移 概 率 依赖 于 h 一 t, 但 是 不 依赖 于 +， 
则 过 程 有 一 个 平稳 的 转移 分 布 . 


12.1 马尔 可 夫 链 模拟 


考虑 参数 向 量 为 6 和 数据 为 X 的 推断 问题 , 其 中 9 e e. 为 了 做 出 推断 , 我 
们 需要 知道 分 布 P(O|X). 马尔 可 夫 链 模拟 的 思想 是 在 @ 上 模拟 一 个 马尔 可 夫 过 
程 , 它 收敛 于 平稳 转移 分 布 P(0|X). 
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马尔 可 夫 链 模拟 的 关键 是 构造 一 个 具有 指定 的 平稳 转移 分 布 P(0|X) 的 马尔 
可 夫 过 程 , 并 且 充 分 长 地 运行 这 个 模拟 ， 使 得 过 程 当前 值 的 分 布 与 平稳 转移 分 布 足 
够 接近 . 对 给 定 的 POX), 可 以 证 明 能 够 构造 许多 具有 所 需 性 质 的 马尔 可 夫 链 . 我 
们 将 利用 马尔 可 夫 链 模拟 来 得 到 分 布 P(0LX) 的 方法 称 为 MCMC 方法 . 

在 统计 文献 中 , MCMC 方法 以 各 种 各 样 的 形式 发 展 . 考虑 数据 分 析 中 的 “缺失 
值 ”问题 . 本 书 中 讨论 的 统计 方法 都 是 在 “完全 数据 *( 即 没有 缺失 值 ) 的 假定 下 发 
RERI. 例如 , 在 给 资产 收益 率 的 日 波动 率 建 模 时 ， 我 们 假定 样本 期 间 内 的 收益 率 数 
据 在 所 有 交易 日 都 可 以 得 到 . 如 果 存 在 一 个 缺失 值 , 那 我 们 应 该 怎么 办 呢 ? 

Dempster, Laird 和 Rubin (1977) 提出 一 个 称 为 EM 算法 的 迭代 方法 来 解决 这 
个 问题 . 这 个 方法 包含 两 个 步骤 . 第 个 步骤 , 如 果 缺 失 值 可 以 得 到 ， 则 我 们 能 够 利 
用 完全 数据 分 析 的 方法 来 建立 一 个 波动 率 模型 . 第 二 个 步骤 给 定 可 以 利用 的 数据 
及 拟 合 的 模型 , 我 们 能 够 推导 出 缺失 值 的 统计 分 布 . 填充 缺失 值 的 一 个 简单 方法 是 
利用 缺失 值 的 导出 分 布 的 条 件 期 望 . 在 实际 中 ， 可 以 用 缺失 值 的 一 个 任意 值 来 开始 
这 个 方法 , 且 返 代 足 够 多 的 次 数 直到 收敛 . 前 面 方法 中 的 第 一 个 步骤 涉及 对 一 个 指 
定 的 模型 进行 最 大 似 然 估计 , 称 为 M 3b. 第 二 个 步骤 是 计算 缺失 值 的 条 件 期 望 , 称 
^ EZ. 

Tanner 和 Wong (1987) 以 两 种 方式 扩展 了 EM 算法 . 首先 , 他 们 引进 了 和 迭代 
模拟 的 思想 . 例如 , 可 以 简单 地 利用 从 缺失 值 的 导出 条 件 分 布 里 抽取 的 一 个 随机 数 
来 代替 缺失 值 , 而 不 是 用 条 件 期 望 来 代替 . 其 次 , 他 们 利用 数据 扩张 的 概念 扩展 了 
EM 算法 的 应 用 . 数据 扩张 意味 着 在 所 研究 的 问题 中 加 入 一 个 辅助 变量 . 可 以 证 明 
许多 的 模拟 方法 通常 可 以 通过 数据 扩张 来 简单 化 或 加 速 . 参见 本 章 的 最 后 一 节 


12.2 Gibbs 抽样 


Geman 和 Geman KA (1984) 以 及 Gelfand 和 Smith(1990) 的 Gibbs 抽样 (或 
Gibbs FFAS) 可 能 是 最 流行 的 MCMC 方法 . 我 们 通过 一 个 带 三 个 参数 的 简单 问题 
来 引进 Gibbs 抽样 的 思想 . 这 里 所 用 的 单词 “参数 ” 的 意义 非常 广泛 . 在 MCMC 框 
AR P, 一 个 缺失 的 数据 点 就 可 以 当 作 一 个 参数 . 类 似 地 . 一 个 不 可 观测 的 变量 如 资 
PAA) SCS” 价格, 在 及 个 交易 价格 可 以 得 到 的 情况 下 , 也 可 以 认为 是 N AS 
Jk. “参数” 这 个 概念 与 数据 扩张 是 联系 在 一 起 的 , 这 在 我 们 讨论 MCMC 方法 的 应 
用 时 将 会 变 得 很 清楚 . 

将 这 三 个 参数 分 别 表示 为 01, 02 Fl 05. 4 X 表示 可 用 的 数据 集 , M 表示 采用 
的 模型 . 这 里 的 目标 是 估计 这 些 参数 以 便利 用 拟 合 的 模型 做 出 推断 . 假定 模型 的 似 
然 函 数 很 难得 到 , 但 是 在 给 定 其 他 两 个 参数 的 条 件 下 . 单个 参数 的 条 件 分 布 是 可 以 
得 到 的 . 换 句 话说 , 我 们 假定 已 知 下 面 的 三 个 条 件 分 布 : 


fi(01|02,03, X, M),  f2(02|03,01, X, M), f3(93|0;, 02, X , M), (12.1) 
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其 中 f,(0;\0;4;,X,M) 表示 给 定数 据 、 模型 以 及 其 他 两 个 参数 的 条 件 下 , 参数 0, 的 
条 件 分 布 . 应 用 中 , 我 们 不 需要 知道 条 件 分 布 的 精确 形式 . 需要 的 是 从 三 个 条 件 分 
布 的 每 一 个 中 抽取 随机 数 的 能 力 . 
令 0o 和 bo 是 9 和 0, 的 两 个 任意 的 初始 值 , 则 Gibbs 抽样 如 下 进行 : 
(1) 从 f1(01|02,0; 03,0, X, M) 中 抽取 一 个 随机 样 木 , 并 将 抽取 的 随机 数 记 为 6; 
(2) 从 fa(02]03,0, 01,1, X , M) 中 抽取 一 个 随机 样本 , 并 将 抽取 的 随机 数 记 为 83; 
(3) 从 fa(83101,1,02,1, X, M) 中 抽取 一 个 随机 样本 , 并 将 抽取 的 随机 数 记 为 03. 
这 就 完成 了 一 次 Gibbs 迭代 , 且 参 数 变 为 1, 021 和 04, 
下 一 步 , 利用 新 参数 作为 初始 值 , 重复 前 面 随机 抽取 的 迭代 , 我 们 可 以 完成 为 
一 次 Gibbs 迭代 , 并 得 到 更 新 的 参数 91.2, 92.2 和 03,2. 我 们 可 以 重复 前 面 的 迭代 m 
次 , 得 到 一 系列 的 随机 抽取 : 


(03.1, 851, 03.1), pas (Boss 05. m5 05.5). 


在 一 些 正则 性 条 件 下 , 可 以 证 明 对 一 个 充分 大 的 mn, (Om 82m 03,5) 渐 近 等 价 于 来 
自 于 三 个 参数 的 联合 分 布 F(bi,g2,b3| 瑟 ,MT) 的 一 个 随机 抽取 . 正则 性 条 件 是 弱 的 . 
它们 本 质 上 是 要 求 对 一 个 任意 的 初始 值 (81,0, 82,0. 03,0), 前 述 的 Gibbs 迭代 有 机 会 
访问 整个 参数 空间 真实 的 收敛 定理 涉及 到 利用 马尔 可 夫 链 的 理论 . 参见 Tierney 
(1994). 

实际 中 , 我 们 利用 一 个 充分 大 的 n, 并 且 丢 掉 Gibbs 迭代 的 前 m 个 随机 抽取 ， 
来 建立 一 个 Gibbs 样本 , 即 


(imti lamti 93,m+1)s*** 5 (01,55 02,5. 03,5). (12.2) 


因为 前 面 的 迭代 建立 了 一 个 来 自 联 合 分 布 f(01,09,03 1X, M) 的 随机 样本 , 所 以 可 
以 利用 它们 来 做 出 统计 推断 . 例如 , b 的 一 个 点 估计 及 其 方差 为 


i 1 n F 1 rh 9 
a= n— n P? Qi ôi = n—m-1 i (0i,; — 9) . (12.3) 
j-m41 j=m+1 


(12.2) 式 中 的 Gibbs 样本 可 以 有 许多 种 使 用 方法 . 例如 , 如 果 对 于 检验 原 假设 
Ho : 01 — 02 对 备 择 假设 Ha : 9 A 05 感 兴趣 , 则 可 以 简单 地 得 到 9 = 0, — 0» 的 所 
估计 与 其 方差 为 


^ 1 S e" 1 n = 
90 = mm p» (01,; — 02,5). g“ = AA ps (01,5; — 05, — 0) ‘ 
Jes j=m+l 


则 原 假设 可 以 利用 传统 的 t- 比 统计 量 t= 0/6 来 检验 . 

注释 1: Gibbs 抽样 中 被 丢掉 的 前 m 个 随机 抽取 通常 称 为 预 烧 (burn-in) 祥 
A. 预 烧 样本 用 来 保证 (12.2) 式 中 的 Gibbs FAMES RAKSHA f(O, 42, 03|X, 
M) 中 的 随机 样本 足够 接近 . 口 
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注释 2: ”前面 讨论 的 方法 包含 了 运行 单个 长 链 并 在 预 烧 后 保留 所 有 随机 机 取 
得 到 一 个 Gibbs 样本 . 另 一 种 方法 是 利用 不 同 的 初始 值 和 一 个 相对 小 的 n 运行 许 
多 相对 短 的 链 . 在 每 条 链 中 , 最 后 一 次 Gibbs 迁 代 的 随机 抽取 都 可 以 用 来 建立 一 个 
Gibbs 样本 . 口 

申 前 面 的 介绍 , Gibbs 抽样 有 具有 这 样 一 个 优点 , 即将 一 个 高 维 的 估计 问题 利用 
所 有 参数 的 条 件 分 布 分 解 为 几 个 较 低 维 数 的 问题 . 极端 地 , 一 个 具有 N 个 参数 的 
高 维 问题 可 以 通过 利用 N 个 1 维 的 条 件 分 布 迭 代 地 解决 ， 这 个 性 质 使 得 Gibbs 
抽样 非常 简单 且 广 泛 应 用 .然而 , 将 所 有 的 随机 抽取 都 简化 为 1 维 问题 通常 不 是 
有 效 的 . 当 参 数 高 度 相关 时 , 值得 将 它们 联合 地 抽取 . 作为 说 明 , 考虑 三 个 参数 的 
例子 .如 果 0, 和 0。 是 高 度 相 关 的 , 则 可 以 在 任何 可 能 的 情况 下 , 采用 条 件 分 布 
f(01,02]03, X, M) 和 f3(03|01,02,X,M). 这 时 一 次 Gibbs 迭代 包含 ， 

(a) 给 定 04 的 条 件 下 联合 抽取 (01, 02); 

(b) 给 定 (01,02) 的 条 件 下 抽取 03. 
关于 参数 相关 性 对 Gibbs 抽样 收敛 速度 的 影响 , 更 多 的 信息 可 以 参见 Lin, Wong 和 
Kong (1994). 

在 实际 中 , Gibbs 样本 的 收敛 性 是 一 个 重要 问题 . 8 EBUUB HI eR AR A 
m 充分 大 时 收敛 发 生 , 而 没有 对 m 的 选择 提供 具体 的 指导 . 许多 文献 已 经 建议 了 
多 种 检验 Gibbs 样本 收敛 性 的 方法 . 但 它们 并 没有 得 出 关于 哪个 方法 执行 得 最 好 
的 一 致 结论 . 事实 上 , 没有 任何 一 个 可 以 利用 的 方法 能 100% 地 保证 所 研究 的 Gibbs 
样本 对 所 有 的 应 用 都 是 收敛 的 . 检验 方法 的 表现 通常 依赖 于 所 处 理 的 问题 . 实际 应 
用 中 必须 要 注意 这 一 特点 , 以 保证 没有 明显 的 对 收敛 性 要 求 的 违背 . 对 收敛 性 的 检 
验方 法 参见 Carlin and Louis (2000) 以 及 Gelman 等 人 (1995). 应 用 中 , 以 不 同 的 
初始 值 重复 Gibbs 抽样 几 次 来 保证 算法 收敛 是 很 重要 的 . 


12.3 ” 贝 叶 斯 推断 


在 Gibbs 抽样 中 条 件 分 布 起 着 重要 的 作用 . 在 统计 文献 中 ， 这 些 条 件 分 布 被 称 
为 条 件 后 验 分 布 (conditional posterior distributions). 因为 它们 是 在 数据 、 其 他 参数 
和 一 定 的 模型 给 定时 参数 的 分 布 . 本 节 将 回顾 一 些 在 MCMC 方法 中 有 用 的 著名 的 
后 验 分 布 . 


12.3.1 后 验 分 布 


有 两 种 统计 推断 的 方法 . 第 一 种 方法 是 基 十 最 大 似 然 原理 的 经 典 方法 . 此 时 模 
型 通过 最 大 化 数据 的 似 然 孙 数 进行 估计 , 且 利 用 拟 合 的 模型 做 出 推断 . 另 一 种 方法 
是 贝 叶 斯 推断 , 它 将 先 验 的 思想 与 数据 结合 得 到 后 验 分 布 , 然后 基于 后 验 分 布 进 行 
统计 推断 . 历史 上 , 在 两 类 统计 推断 之 间 有 着 激烈 的 争论 , 但 经 证 明 两 种 方法 都 是 
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有 用 的 , 而 且 现在 都 被 广泛 接受 . 到 目前 为 止 , 本 书 讨论 的 方法 都 属于 经 典 方法 . 然 
而 , 对 所 考虑 的 所 有 问题 , 贝 叶 斯 解 都 是 存在 的 . 近年 来 随 着 MCMC 方法 的 发 展 
尤其 如 此 , 这 是 因为 MCMC 方法 大 大 改善 了 贝 叶 斯 分 析 的 可 行 性 . 读者 可 以 重新 
回顾 一 下 前 几 章 , 并 导出 所 考虑 问题 的 MCMC 解 . 大 多 数 情 形 下 , 贝 叶 斯 解 类 似 于 
我 们 以 前 已 有 的 结果 . 有 些 情形 , 贝 叶 斯 解 可 能 优 于 其 他 解 . 例如 , 考虑 第 7 章 中 
VaR 的 计算 , 贝 叶 斯 解 可 以 很 容易 地 将 VaR 计算 中 参数 的 不 确定 性 考虑 在 内 . 然 
而 , 这 种 方法 要 求 大 强度 的 计算 . 

4 6 为 所 采用 模型 的 末 知 参数 向 量 , X 是 数据 ， 贝 叶 斯 分 析 寻 求 将 关于 参数 
的 己 获 信息 与 数据 相 结 合 来 做 出 推断 ， 参 数 的 已 获 信息 通过 对 参数 预先 指定 一 个 
先 验 分 布 表示 , WA P(9). 对 一 个 给 定 的 模型 , 用 (入 |9) 表示 数据 的 似 然 函数 . 由 


ere f(0,X)  f(X|8)P(0) 
aa mAb C 


这 里 边际 分 布 可 以 通过 下 式 得 到 


(12.4) 


f(X) — | f(X.6)a6 = | J(X8)P(0)46. 


(12.4) 式 中 的 分 布 £(0| X) 称 为 9 的 后 验 分 布 (posterior distribution). 一 般 来 讲 , 我 
们 可 以 利用 贝 叶 斯 准则 得 到 


f(O|X) x f(X|0)P(60), (12.5) 


其 中 P(6) 是 先 验 分 布 , 1(XI9) 是 似 然 函数 . 由 (12.5) 5X, 基于 似 然 函 数 CX 0) 
作出 统计 推断 相当 于 利用 具有 固定 先 验 分 布 的 贝 叶 斯 方法 . 


12.3.2 HHA 


一 般 来 讲 , 得 到 (12.4) 式 中 的 后 验 分 布 并 不 是 一 件 简单 的 事 , 但 是 也 有 先 验 分 
布 与 后 验 分 布 属 于 同一 分 布 族 的 情形 .此 类 先 验 分 布 称 为 共 轿 (conjugate) 先 验 分 
布 . 对 MCMC 方法 , 使 用 共 斩 先 验 意味 着 可 以 得 到 条 件 后 验 分 布 的 一 个 闭 型 解 , 然 
后 则 可 以 利用 通常 的 概率 分 布 的 计算 路 线 得 到 Gibbs 样本 的 随机 抽取 . 下面, 我 
们 回顾 一 些 著 名 的 共 斩 先 验 分 布 . 更 多 的 信息 , 读者 可 以 参考 有 关 贝 时 斯 统计 的 书 
(如 DeGroot 1990, 第 9 $). 
结果 1 假定 z1,… ,zn 是 从 均值 为 J( 未 知 )、 方差 为 cz( 已 知 且 为 正 数 ) 的 正 态 
分 布 中 抽取 的 一 个 随机 样本 . 并 假定 .4 的 先 验 分 布 是 均值 为 jwo、 方差 为 8 的 止 态 
分 布 , 则 给 定数 据 和 先 验 分 布 的 条 件 下 , y 的 后 验 分 布 是 均值 为 hv、 方差 为 o2 的 
正 态 分 布 , p 和 o? 由 下 式 给 出 : 


o? po 十 noT 2 a 
SS rà O; 


2,2 
COMM des n 
c? + noe ao? + noe’ 
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其 中 天 一 zi/n 是 样 木 均 值 . 


在 贝 叶 斯 分 析 中 , 为 方便 通常 使 用 精度 参数 ) — 1/o2( 即 方差 o 的 逆 )、 将 先 
验 分 布 的 精度 参数 表示 为 no = 1/02, 后 验 分 布 的 精度 参数 表示 为 Me = 1/07, WA 
AR 1 可 以 改写 为 

Ne = no +NN, be X Ho +7 x. 

对 所 考虑 的 正 态 随机 样本 , 关于 / 的 数据 信息 包含 进 了 样本 均值 却 它 是 pe 的 充分 
统计 量 . z 的 精度 为 n/o? = nn, 因此 , 结果 1 说 明 (a) 后 验 分 布 的 精度 为 先 验 分 布 
的 精度 和 数据 的 精度 之 和 ; (b) 后 验 均 值 是 先 验 均值 和 样本 均值 的 加 权 平 均 , 权重 
与 精度 成 正比 . 这 两 个 公式 也 说 明了 当 样 本 量 n 增加 时 , 先 验 分 布 的 贡献 将 降低 . 

涉及 线性 回归 模型 时 , 结果 1 的 一 个 多 元 形式 在 MCMC 方法 中 特别 有 用 . 参 
见 Box and Tiao (1973). 
结果 la 假定 zi,…… ,zn 是 来 自 均值 向 量 为 p, BAT ERY X 的 多 元 正 
态 分 布 的 随机 样本 . 又 假定 u 的 先 验 分 布 是 均值 向 量 为 Ao、 协 方差 矩阵 为 Xo H 
多 元 正 态 分 布 . W u 的 后 验 分 布 也 是 多 元 正 态 的 , 其 均值 向 量 为 六、 协 方差 矩阵 
2 EV 

3. —35! eas y= tn 


其 中 z= È vi/n 是 样本 均值 且 服 从 均值 为 凡 、 协 方差 矩阵 为 互 /n 的 多 元 正 态 . 值 


得 注意 的 是 ， nE) Jè z WARE, 且 Xx! 是 先 验 分 布 的 精度 矩阵 . 
称 一 个 随机 变量 n 服从 具有 正 参数 a 和 8 的 伽 玛 分 布 , 如 果 它 的 概率 密度 函 
数 为 


fla, 8) = v ;' j^^ e,» n>0, 


这 里 T (0) 为 伽 马 函 数 . 对 于 这 个 分 布 , E(n) = a/B var(n) = a/8. 
结果 2 ”假定 c, 是 来 自给 定 均值 为 .、 未 知 精度 为 n 的 正 态 分 布 的 随机 
样本 . 如 果 n 的 先 验 分 布 是 具有 正 参数 o 和 6 的 伽 玛 分 布 , 则 7 的 后 验 分 布 也 是 
伽 玛 分 布 , 其 参数 分 别 为 e+ (n/2) 和 B+ ps (z: — u)* 2. 

称 一 个 随机 变量 9 服从 具有 正 参数 a 和 4 的 贝塔 分 布 , n RC HIRED RR 
数 为 


T'(a 4- 8) 
P(a)T (8) 
9 的 均值 为 EB(9) = a/(a +8) THA — Var(8) = a8/{(a + B) (a + 8+ 1)]. 
结果 3 (DE zt- ,wn 是 来 自 参 数 为 0 的 伯 努 利 分 布 的 随机 样本 . 如 果 0 的 先 


验 分 布 是 具有 给 定 正 参数 a 和 8 的 贝塔 分 布 , 则 9 的 后 验 分 布 也 是 贝塔 分 布 , 参 
数 分 别 为 a+ x Al 8--n— »E 


f(@\a, 8) = gr-1(4.—8yf-1. 946.31. 
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结果 4 假定 mecs 是 来 自 参数 为 A 的 普 哇 松 分 布 中 抽取 的 随机 样本 ， 又 假 
s A 的 先 验 分 布 是 具有 给 定 的 正 参数 aa 和 的 伽 玛 分 布 , 则 入 的 后 验 分 布 也 是 徊 
玛 分 布 , 参数 为 a+ x z, A B+n. 


结果 5 ”假定 z1,.… tn 是 来 自 参数 为 ^ 的 指数 分 布 的 随机 样本 . 如 果 和 的 先 验 
分 布 是 具有 给 定 正 参数 a 和 3 的 伽 玛 分 布 , 则 和 的 后 验 分 布 也 是 伽 玛 分 布 , 参数 
PMA atn M B+ Yan 

称 一 个 随机 变量 X 服从 参数 为 m 和 和 的 负 二 项 分 布 , 这 里 m > 0,0 < 入 < 1， 
如 果 它 的 概率 函数 为 


m --n-—1 x: 
A" (1— A)", EI, 
p(n|m, A) = | ( n ) ( ) d l 


0, 其 他 . 


金融 中 负 二 项 分 布 的 一 个 简单 例子 是 : 假定 应 聘 者 是 独立 的 并 且 每 个 应 聘 者 是 最 
好 人 选 的 概率 为 人, 问 在 一 个 公司 发 现 对 它 的 m 个 空缺 的 m 个 “恰当 的 供 选 人 ” 
以 前 需要 面试 多 少 个 MBA 毕业 生 ? 用 Y 表示 全 部 应 聘 者 的 数量 , WX —Y —m 
服从 参数 为 rm 和 和 的 负 二 项 分 布 . 
结果 6 ”假定 x1,… ,xz 是 来 自 参数 为 m 和 入 的 负 二 项 分 布 的 随机 样本 , 这 里 m 
是 正 的 , 而 且 是 固定 的 . 如 果 和 的 先 验 分 布 是 具有 给 定 的 正 参数 a 和 6 的 贝塔 分 
布 , 则 和 的 后 验 分 布 也 是 贝塔 分 布 , 参数 分 别 为 a+ mn 和 B+ x ti. 
下 面 我 们 考虑 具有 未 知 均 值 p 和 未 知 精度 m 的 正 态 分 布 的 情形 二 维 的 先 验 
分 布 分 解 为 Plun) = 
结果 7 ”假定 zi,.… ,zn 是 来 自 未 知 均值 为 y 和 未 知 精度 为 n 的 正 态 分 布 的 随机 
样本 . 又 假定 给 定 n 二 Wo F, u 的 条 件 分 布 是 均值 为 jo、 精度 为 mm WESA, 
ME n 的 边际 分 布 是 具有 正 参数 a 和 有 的 伽 蔚 分 布 , 则 给 定 n = wo 的 条 件 下 , jp 
的 条 件 后 验 分 布 是 均值 为 4。 精度 为 nj. 的 正 态 分 布 , 且 
_ Topo + nz 
Tom ” 


Kp z= Y z,/n 是 样本 均值 , BH. n 的 边际 后 验 分 布 是 参数 为 a 十 (n/2) 和 8. 的 
伽 玛 分 布 ， 其 中 


= (To +n)mo, 


B: 7 4, Tonle — pp)” 
nid 3B aic 9j 2(To4-n) - 


当 对 随机 变量 的 条 件 方差 感 兴趣 时 ， 通常 使 用 逆 卡 方 分 布 (或 逆 x). 称 随机 
变量 Y 服从 自由 度 为 v 的 逆 x? 分 布 , 如 果 1/Y 服从 自由 度 为 的 x? 分 布 .Y 的 
概率 密度 函数 为 

9—v/2 


(ylv) = T(/2j (v/2£)e-1/QV) ay 0, 
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对 于 这 个 分 布 , 我 们 有 : 如 果 vw > 2, 则 E(Y) — 1/(v — 2); WR v > 4, 则 Var(Y) = 
2/[(v — 2)?(v — 4)]. 

结果 8 ”假定 a1,.… ,a,, 是 来 自 均值 为 0、 方 差 为 o? 的 正 态 分 布 的 随机 样本 ， 又 
假定 o? 的 先 验 分 布 是 自由 度 为 v 的 逆 x? 分布 即 , (vA)/o? ~ x2, 其 中 入 > 0), 则 
o? 的 后 验 分 布 也 是 道 x? 分 布 , IEA hEN v+ n, BD (vd + a2)/o? ~ Xin: 


12.4 ”其 他 算法 


在 许多 应 用 中 , 条 件 后 验 分 布 没 有 闭 型 解 . 但 是 某 些 统计 文献 已 经 提出 了 许多 
好 的 算法 来 克服 这 个 困难 . 本 节 将 讨论 一 些 这 样 的 算法 . 


12.4.1 Metropolis 算法 


当 条 件 后 验 分 布 已 知 并 且 不 是 标准 化 的 常数 时 ，Metropolis 算法 是 可 行 的 . 2 
JL Metropolis 和 Ulam (1949) 以 及 Metropolis 等 人 (1953). 假设 我 们 希望 从 分 布 
FOX) 中 抽取 一 个 随机 样本 . 然而 它 包 含 了 一 个 复杂 的 标准 化 常数 , 直接 抽取 要 么 
太 浪 费时 间 , 要 么 不 可 行 . 值得 庆幸 的 是 , 存在 一 个 近似 分 布 , 利用 它 可 以 很 容易 地 
得 到 随机 抽取 .Metropolis 算法 就 是 从 近似 分 布 中 产生 一 系列 的 随机 抽取 , 有 旦 其 分 
布 函数 收敛 到 F(0| X). 此 算法 如 下 进行 : 
(1) 抽取 一 个 随机 的 初始 值 05, 满足 f(@o|X) > 0. 
(2) 1 —1,2,-.-, 
a. 28 t UREA, 在 给 定 前 面 的 抽取 0, . F, 从 已 知 分 布 中 抽取 一 个 候选 样 
本 0,. 用 HOO) 表示 已 知 分 布 . 在 Gelman 等 人 (1995) 中 称 此 分 布 为 
33K 2-78 (jumping distribution), 也 可 以 称 作 建议 分 布 . 这 个 跳跃 分 布 一 定 
是 对 称 的 , 即 对 于 所 有 的 0,0; Fl t, 有 大 (9il9j) = Jı(0;|0;). 
b. 计算 比率 


tos f(0.|X) 
f(6..11X) 
c. WE 
CA 0., 以 概率 min(r, 1), 
0,3, 其 他 . 
在 一 些 正则 性 条 件 下 , 序列 (0,) 依 分 布 收 伍 到 0X). 参见 Gelman 等 人 
(2003). 


算法 的 实施 要 求 对 所 有 的 9。 和 0, . 计算 比率 了 , 从 跳跃 分 布 中 抽取 9,, 并 
从 均匀 分 布 中 抽取 一 个 随机 实现 以 决定 接受 或 者 拒绝 9,. 不 需要 OX) 的 标准 
化 常数 , 因为 这 里 只 利用 比率 . 

此 算法 的 接受 和 拒绝 准则 可 以 陈述 如 下 : ( WRA 0 到 0. 的 跳跃 增加 了 
条 件 后 验 密度 , 则 接受 0. 作为 0,; (ii) 如 果 这 个 跳跃 降低 了 密度 , 则 以 等 于 密度 比 
r 的 概率 设 定 0, —0., 否则 设 定 0, = 94_1. 这 个 程序 看 上 去 是 合理 的 . 
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对 称 跳跃 分 布 的 例子 包括 均值 参数 的 正 态 分 布 和 学 生 一 上 分 布 . 对 给 定 的 协 方 
差 矩阵 , 我 们 有 f(0,0;) = 7(0,0:) , 其 中 f(0100) 表示 均值 向量 为 00 的 多 元 正 态 
密度 函数 . 


12.4.2 Mcetropolis-Hasting 算法 


Hasting(1970) 通过 两 种 方式 推广 了 Metropolis 算法 . 首先 , 跳跃 分 布 没 有 必要 
一 定 是 对 称 的 . 其 次 , 跳跃 准则 修正 为 
dcs f(0.1X)/J4(8.101) — — f(0.1X)«(0,—1]0.) 
f(06511X)/44(06 310.) — f(063]X)«(0. 005) 
这 个 修正 的 算法 称 为 Metropolis - Hasting 算法 . Tierney(1994) 探讨 了 提高 该 算法 
计算 效率 的 方法 . 


12.4.8 ”格子 Gibbs 抽样 


在 金融 应 用 中 , 所 采用 的 模型 可 能 包含 一 些 非 线 性 参数 (如 : ARMA 模型 中 
的 滑动 平均 参数 或 波动 率 模型 中 的 GARCH 参数 )， 因 为 非 线性 参数 的 条 件 后 验 
分 布 没 有 闭 型 表示 , 所 以 在 这 种 情形 下 执行 Gibbs 抽样 可 能 将 变 得 复杂 , 即使 对 
Metropolis - Hasting 算法 也 是 如 此 ， 当 条 件 后 验 分 布 是 1 维 时 ，Tanner(1996) 给 
出 了 一 个 简单 程序 来 得 到 Gibbs 抽样 中 的 随机 抽取 . 这 个 方法 称 为 格子 Gibbs dà 
样 (Griddy Gibbs sampler) 且 应 用 广泛 . 然而 , 在 实际 应 用 中 此 方法 可 能 并 不 有 效 . 

令 0, 表示 具有 条 件 后 验 分 布 f(90;|XX,9_;) 的 纯 量 参数 , 其 中 9_; 是 剔除 0; 之 
后 的 参数 向 量 . 例如 , 如 果 6 — (01,02,83), W 0 ., — (82,03). 格子 Gibbs 抽样 进行 
如 下 : 

(1) 从 0; 的 一 个 恰当 选择 的 区 间 上 选择 格子 点 , 记 为 0 < Oiz < +++ < 0im. fh 
计 条 件 后 验 密度 函数 , 得 到 由 — [(065]X,0 :), jl, mj 

(2) 利用 wi, wm 得 到 FIX, 0) 闭 累 积分 布 函数 的 一 个 近似 ; 

(3) 抽取 一 个 均匀 (0, 1) 随机 变量 , 并 通过 近似 的 逆 累 积分 布 函数 对 这 个 观测 
进行 变换 , 得 到 0; 的 一 个 随机 抽取 . 

下 面 依次 给 出 关于 格子 Gibbs 抽样 的 一 些 注 释 . 首先 , 并 不 需要 条 件 后 验 分 
布 f(0,X,0..,) 的 标准 化 常数 , 因为 , 逆 累 积分 布 函数 可 以 从 {w 直接 得 到 . 
其 次 , 道 累积 分 布 函 数 的 一 个 简单 近似 是 (06,,) 7, 的 离散 分 布 , 概率 为 p(0;;) = 
wi/ Y wy. 最后, 在 实际 应 用 中 , 参数 0, 的 区 间 [Ga 0im] 的 选择 必须 仔细 检验 
一 个 简单 的 检验 程序 是 考虑 0, 的 Gibbs 抽样 的 直方 图 . 如果 该 直方 图 显示 0a 或 
bim 周围 的 概率 较 大 , 则 必须 扩展 此 区 间 . 然而 如 果 该 直方 图 显示 概率 集中 在 区 间 
(0:1, im] P3, 则 此 区 间 太 宽 了 , 应 缩短 . 如 果 区 间 太 宽 , 则 格子 Gibbs 抽样 变 得 不 是 
很 有 效 , 这 是 因为 此 时 大 多 数 ui 将 是 0. 最 后 , 格子 Gibbs 或 Metropolis-Hasting 
算法 可 以 用 于 Gibbs 抽样 以 得 到 - 些 参数 的 随机 抽取 . 
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12.5 ” 带 时 间 序 列 误差 的 线性 回归 


我 们 准备 考虑 MCMC 方法 的 一 些 具 体 应 用 . 下 面 几 节 中 讨论 的 例子 只 是 为 了 
有 助 于 读者 深入 了 解 MCMC 方法 在 金融 中 的 应 用 . 
第 一 个 例子 是 估计 一 个 带 序列 相关 误差 的 回归 模型 ， 这 是 第 2 章 中 讨论 的 一 
个 主题 , 那里 我 们 用 SCA 进行 估计 . 该 模型 的 一 个 简单 形式 为 
Ye = Bo + Bye +--+ + Beane + Zt, 
Zt — P21 Hat, 
其 中 y, 是 响应 变量 ; zit 是 解释 变量 , 它 可 能 包含 ye 的 延迟 值 ; ze 服从 简单 的 AR(1) 
模型 ， 且 {ay} FEB) n BO IE AS BAL RU 99, 均值 为 0、 方差 2. 用 8 = 
(B'a?) 表示 这 个 模型 的 参数 , 其 中 p= (Bo, B1, -- Be)’, & ae = (1, mi Eke) 
为 时 刻 t 所 有 回归 因子 组 成 的 向 量 , 包括 一 个 单位 常数 . 模型 变 为 


= 二 六 = 二 让 (12.6) 


其 中 为 样本 容量 . 

这 种 情形 下 进行 Gibbs 抽样 的 一 个 自然 方法 是 在 回归 估计 和 时 间 序 列 估 计 之 
间 进 行 迭代 . 如 果 已 知 这 个 时 间 序 列 模型 , 则 我 们 可 以 利用 最 小 二 乘 方法 很 容易 地 
估计 回归 模型 . 然而 , 如 果 回 归 模型 是 已 知 的 , 则 我 们 可 以 利用 z, = v. — 218 得 到 
时 间 序 列 ze, 并 利用 这 个 序列 估计 AR) 模型 . 因此 , 我 们 需要 下 面 的 条 件 后 验 分 
布 : 

F(BIY,X,¢,07), FOY. X, B, o?) f(o?|¥,X,B,¢), 

其 中 Y = (m, un), 六 表示 解释 变量 所 有 观测 值 的 集合 . 

我 们 利用 共 二 先 验 分 布 得 到 条 件 后 验 分 布 的 一 个 闭 型 表达 . 先 验 分 布 为 


: vA 
B~ N(B Xo) ¢~N(d0.09), Tx. (12.7) 


这 里 ~ 表示 分 布 , By, Xo. A, v, do 和 oa 是 已 知 量 . 在 贝 叶 斯 推断 中 , 这 些 量 称 为 
HBR (hyperparameters). 它们 的 精确 值 依赖 于 要 处 理 的 问题 . 典型 地 , 我 们 假定 
Bo = 0, do = 0, H. o 表示 具有 很 大 对 角 元 素 的 对 角 阵 . 同时 假定 (12.7) 式 中 的 先 
验 分 布 相互 独立 . 因此 , 我 们 可 以 使 用 基于 参数 向 量 9 的 分 解 的 独立 先 验 分 布 . 
条 件 后 验 分 布 (BIY, 关 ,9,o?) 可 以 通过 12. 3 节 的 结果 a 得 到 . 具体 来 讲 ， 
给 定 办 我 们 定义 
Yot— Yt —OYt-1, Lor = Tt — Ta. 


利用 (12.6) 式 , 我 们 有 


Yor = P'Tot + an t=2,...,n. (12.8) 
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在 {ax} 的 假定 下 , (12.8) 式 是 一 个 多 元 线性 回归 . 因此 , 关于 参数 向 量 B 的 数据 信 
息 包 含 在 它 的 最 小 二 乘 估计 


n -1 n 
iss (x vt (x earns) 
t=2 t=2 


rp, 且 这 个 最 小 二 乘 估计 具有 多 元 正 态 分 布 


n -1 
a ry N a. (x rast) | . 
t=2 


利用 结果 la, ABH. 6 以 及 o? 的 条 件 下 , 8 的 后 验 分 布 是 多 元 正 态 的 . 我 们 将 
BREA 

(8|Y ,X,¢,0) ~ N(B.,, 2,), (12.9) 
其 中 参数 由 下 式 给 出 


^ MN 
y»! EJ t=2 © 0,20,t 
* Ps g? 


Lo pe 
£X B.-X Ga LI 


B 4 X By) 
下 面 考虑 给 定 B, cz 和 数据 条 件 下 , o 的 条 件 后 验 分 布 . AA 8 给 定 , 所 以 对 
所 有 的 t, 可 以 计算 z, = 一 Bw. 考虑 AR(1) 模型 


2: = $211 Hat, = sp 
A 4 的 似 然 函 数 信 息 包 含 在 最 小 二 乘 估 计 


n = n 
Ee) Ems 
t—2 t-2 


n —1 
中 , 它 服从 均值 为 6. 77328 0? ( $ 2.1) 的 正 态 分 布 . 根据 结果 1, o RUGS 
也 是 正 态 分 布 , 且 其 均值 为 内、 ZA o2, 其 中 
0 一 2 一 Beata +057 (090570, 2 (Ea 2 7- t+ 05740) (12.10) 
最 后 , 考虑 给 定 B, 由 和 数据 的 条 件 下 , c? 的 后 验 分 布 . 因为 BA 6 已 知 , 我 们 
可 以 计算 | 
m= $a, zt-—y-—fax, t= ,n. 
由 12. 3 节 的 结果 8, o? 的 后 验 分 布 是 道 x? 分 布 , BY 
vA + Dian at 
th 
其 中 xz 表示 自由 度 为 大 的 x? 分布. 
利用 (12.9) 一 (12.11) 式 的 三 个 条 件 后 验 分 布 , 我 们 可 以 通过 Gibbs 抽样 估计 
(12.6) 式 , 步骤 如 下 : 


~ Xe rin-ip (12.11) 
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(1) 在 (12.7) 式 中 指定 先 验 分 布 的 超 参数 值 ; 

(2) 指定 B. o Al o? 的 任意 初始 值 (如 不 带 时 间 序 列 误差 的 B 的 普通 最 小 二 乘 
估计 ); 

(3) 利用 (12.9) 式 的 多 元 正 态 分 布 抽取 B 的 一 个 随机 实现 ; 

(4) 利用 (12.10) 式 的 多 元 正 态 分 布 抽 取 o 的 一 个 随机 实现 ; 

(5) 利用 (12.11) 式 的 多 元 x? 分 布 抽取 o? 的 一 个 随机 实现 . 
重复 步骤 3~5 许多 次 迭代 , 得 到 Gibbs FEA. 然后 利用 样本 均值 作为 模型 (12.6) 
中 参数 的 点 估计 . 
例 12.1 为 了 进一步 说 明 , 重 温 第 2 章 中 关于 美国 周 利率 的 例子 . 数据 是 从 1962 
年 1 月 5 日 到 1999 年 9 月 10 日 的 固定 期 限 为 1 年 和 3 年 的 国库 券 利率 , 且 其 来 
自 于 圣 - 路 易 斯 联邦 储备 银行 . 因为 单位 根 非 平 稳 性 , 故 独 立 和 不 独立 的 变量 为 

(1) cat ==73t 一 1734-1, 为 3 年 期 利率 的 周 变 化 ; 

(2) ce = ru — rii, 为 1 年 期 利率 的 周 变 化 ， 

这 里 原始 的 利率 ru 以 百分比 度量 .在 第 2 Be, 我 们 对 数据 采用 了 一 个 带 
MA(1) 误差 的 线性 回归 模型 . 这 里 我 们 考虑 误差 过 程 为 AR(2) 的 模型 . 利用 传统 
方法 , 我 们 得 到 模型 : 


C3t 一 0.000 2 十 0.782c1, "24. Zt = 0.2052, 1 = 0.0682; .9 十 Qi， (12.12) 


其 中 ao, = 0.067. (12.12) 式 中 系数 估计 的 标准 误差 分 别 为 0.001 7,0.008, 0.023 和 
0.023. 除了 残 差 ACE ZEREIR 6 处 的 边际 显著 外 , 前 面 的 模型 看 上 去 是 充分 的 . 
将 模型 写 为 


C3t = Po + Bicie+ Zis 2% = zii + boz-atar, (12.13) 


其 中 {ay} 是 独立 的 且 服从 IN (0,0?) 的 随机 变量 序列 , 我 们 通过 Gibbs 抽样 估计 参 
数 . 前 面 使 用 的 分 布 为 


P ~ N(0,4I2), $- Nio,diag(0.25,0.16)]， (vA)/o? = (10 x 0.1)/e? ~ x?,, 


这 里 I 是 2x2 单位 矩阵 , 初始 参数 估计 是 通过 OLS 方法 得 到 的 ( 即 利用 一 个 两 
步 程 序 , 先 拟 合 一 个 线性 回归 模型 , 然后 对 回归 残 差 拟 合 一 个 AR(2) BUS). 因为 样 
本 量 1 966 很 大 , 所 以 初始 估计 接近 于 (12.12) 式 给 出 的 结果 . 我 们 重复 Gibbs 抽样 
IKK 2 100 次 , 但 抛弃 前 100 个 迭代 结果 . 表 12-1 给 出 了 参数 的 后 验 均 值 和 标准 误 
差 . 图 12-1 给 出 了 每 个 参数 的 边际 后 验 分 布 的 直方 图 . 

我 们 以 不 同 的 初始 值 重复 Gibbs 抽样 , 都 得 到 相似 的 结果 . Gibbs 抽样 看 上 去 
是 收敛 的 . 由 表 12-1, 除了 z2 的 系数 外 , 后 验 均 值 都 接近 于 (12.12) 式 的 估计 . 然 
而 , 办 和 do 的 后 验 标准 误差 相对 较 大 , 显示 了 这 两 个 估计 的 不 确定 性 . 图 12-1 的 
直方 图 包含 了 一 些 有 用 的 信息 . 特别 地 , 它们 表明 o. 和 加 的 分 布 并 不 收敛 到 渐 近 
正 态 ; 分 布 是 右 偏 的 . 然而 , Bo 和 A 的 渐 近 正 态 性 看 似 是 合 理 的 . 
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$2 
12-1 模型 (12.13) 的 2 100 WARN Gibbs 抽样 直方 图 . 结果 基于 后 
2 000 SEK, 先 验 分 布 和 初始 参数 值 在 前 文中 已 给 出 


表 12-1 FA 2 100 RBH Gibbs 抽样 来 估计 的 模型 (12.13) 的 后 验 均值 和 标准 误差 * 


参数 Bo By hı $a c 
均值 0.025 0.784 0.305 0.032 0.074 
标准 误差 0.024 0.009 0.089 0.087 0.003 


a 结果 基于 后 2000 PAR, 先 验 分 布 已 在 文中 给 出 ， 
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12.6 ”缺失 值 和 异常 值 


本 节 将 讨论 处 理 缺 失 值 和 识别 可 加 异常 值 的 MCMC 方法 . 令 {ye}, 表示 观 
测 到 的 时 间 序 列 . 数据 点 加 是 一 个 可 加 异常 值 , 如 果 
ae Th FW, Ft = h, 

"={ 其 他 . 


这 里 w 是 异常 值 的 大 小 , c, 是 没有 异常 值 的 时 间 序 列 . 可 加 异常 值 的 例子 包 
插 记 录 误 差 (如 打字 误差 和 测量 误差 ). 异常 值 可 以 严重 地 影响 时 间 序 列 分 析 , 因为 
它们 可 以 导致 参数 估计 中 的 较 大 偏差 , 并 导致 模型 的 错误 指定 . 

考虑 时 间 序 列 c, 和 固定 的 时 间 指 标 h. 我 们 如 果 把 m 当 作 一 个 缺失 值 , 则 可 
以 了 解 到 关于 它 的 很 多 信息 . 如 果 zx 的 模型 已 知 , 则 给 定 序 列 的 其 他 值 , 我 们 可 以 
推导 出 m 的 条 件 分 布 . 把 观测 到 的 值 y 与 zh 的 导出 分 布 相 比 较 , 可 以 决定 yn 是 
否 可 以 归 为 可 加 异常 值 . 具体 来 讲 , 如 果 y 是 一 个 很 有 可 能 在 导出 分 布下 发 生 的 
值 , 则 yn 不 是 一 个 可 加 异常 值 . 然而 , 如 果 在 导出 分 布下 观测 到 yn 的 机 会 很 小 , 则 
yh 可 以 归 类 为 一 个 可 加 异常 值 . 因此 , 时 间 序 列 分 析 中 异常 值 的 识别 与 缺失 值 的 处 
理 基 于 同样 的 思想 . 

文献 中 , 时 间 序 列 的 缺失 值 可 以 利用 Kalman 滤波 或 MCMC 方法 处 理 . 参见 
Jones (1980) 第 11 章 以 及 McCulloch and Tsay (1994a). 异常 值 识 别 也 被 仔细 研究 
it. 参见 Chang, Tiao and Chen (1988), Tsay(1988), Tsay, Pena and Pankratz(2000) 
及 其 参考 文献 . 异常 值 可 以 按 它们 对 时 间 序 列 影响 的 性 质 分 为 四 类 . 这 里 我 们 集中 
讨论 可 加 异常 值 . 

12.6.1 RAB 
为 了 表示 方便 , 考虑 AR(p) 时 间 序 列 
Le = Pitt. o pri d ae, (12.15) 
其 中 (a) 是 均值 为 0. 772529 o 的 高 斯 白 噪 声 序列 . 假定 样本 区 间 是 从 t= 1 到 
t= n, 但 是 观测 c, 是 缺失 的 , 这 里 1 < h < n. 我 们 的 目标 是 在 出 现 缺 失 值 时 估计 
模型 . 

在 这 个 特例 中 , 参数 为 8 = (p'en 07), 其 中 由 = (办 ,加 ) 这 样 , 我 们 将 

RMA rn 看 作 一 个 未 知 参数 . 如 果 我 们 假定 先 验 分 布 为 
$~ N($,,230) wh 人 ~ N (1o, Zô), A ia x» 
其 中 超 参数 是 已 知 的 , 则 条 件 后 验 分 布 /(8|X,zh,o?) 和 f(o?|X, xn, 6) 正好 是 12.5 


节 中 给 出 的 , 其 中 x 表示 观测 到 的 数据 . 条 件 后 验 分 布 fF(zh|X, 0,07) 是 均值 为 
bes 方差 为 o% 的 1 维 正 态 分 布 . 这 两 个 参数 可 以 利用 线性 回归 模型 得 到 . 具体 来 


(12.14) 
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Vt. 给 定 模型 和 数据 ， Th 仅仅 与 {wi “Th—1 Thl; i 相关 . 记 住 Th 是 
一 个 未 知 参数 , 我 们 可 以 将 其 中 的 关系 如 下 写 出 . 
(1) X} t= h, 模型 为 


Th = O1Th-1 + +++ + PpLa—p tah- 
4 yn = dizi ad Óyth p. bn = —an, 则 前 面 的 方程 可 以 写成 yh = zh 十 bh = 
0902 二 bh, 其 中 po mE 
(2) | t — h-- 1, RNA 


Tayi = Pitan + aA 1 FF PpTnj1 p+ anja, 


令 Yhyi = Taq. 一 bcl 一 一 pz A bags = anti, 则 前 面 方程 为 
Yaoi = PITh + 54a. 


(3) 一 般 地 , X t— hj, j—1,--- p, 我 们 有 
TA|j = Th athe Th ITh 1c ph 


74 hj = Thej — Or Tn4j—1 OO OF41Tn-1 一 人 一 各 Zip A 
bh+j = Qh--j: 前 向 方程 简化 为 Yh+j = PITh 十 bn. j- 

因此 , 对 一 个 AR(p) 模型 , 缺失 值 zh 通过 如 下 2 十 1 个 方程 与 模型 和 数据 相 
KK, 


Yr+j = jth + bhti, j=0,.… yD, (12.16) 

其 中 go = 1. 因为 正 态 分 布 关 于 它 的 均值 对 称 , 所 以 a, 和 a_n 具有 同样 的 分 布 . 
因此 , (12.16) 式 是 一 个 具有 bp 十 1 个 数据 点 的 特殊 的 简单 线性 回归 模型 . x) 的 最 小 
二 乘 估 计 及 其 方差 为 
> co PjYn+j ^ E a? 
aT a re Var(z;,) = Y*.4 Fy ; 
例如 , 5 p = 1 时 , 我 们 有 ên = Tr (zhn-1 + anti), 称 为 zh 的 过 滤 值 . 因为 高 斯 
AR(1) 模型 是 时 间 可 逆 的 , 所 以 对 zs 的 两 个 相 邻 观测 运用 等 权重 得 到 滤波 值 . 

最 后 , 利用 12.3 节 的 结果 1, 我 们 得 到 zh 的 后 验 分 布 是 均值 为 ue 方差 为 o? 
的 正 态 分 布 , 其 中 


Tn = 


x _ Ho + TA ae $5) is. zai 
i gt 00(> 7- 0 $2) "o HOG d 255-0 $i 


缺失 值 可 能 成 堆 发 生 , 导致 了 多 个 连续 缺失 值 的 情形 . 这 些 缺 失 值 可 以 用 两 种 
方法 处 理 . 第 一 种 , 我 们 可 以 直接 推广 前 面 的 方法 得 到 多 个 滤波 值 的 解 . 例如 , 考 
E cn 和 ony, 缺失 的 情形 . 这 些 缺 失 值 与 {zh_py* s Ehh hp) 有 
2X. 我 们 可 以 用 与 以 前 同样 的 方式 定义 一 个 响应 变量 uus, 从 而 建立 一 个 参数 为 
zh 和 ong, 的 多 元 线性 回归 . 然后 利用 最 小 二 乘法 得 到 on 和 ong, 的 估计 . 与 指定 


(12.17) 
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的 先 验 分 布 相 结合 , 我 们 有 对 (srera) 的 一 个 二 元 正 态 后 验 分 布 . TE Gibbs 抽样 
中 , 这 种 方法 可 联合 地 抽取 相连 的 缺失 值 . 第 二 , 我 们 可 以 在 Gibbs KAPRE KAI 
用 (12.17) 式 中 单个 缺失 值 的 结果 . 再 次 考虑 缺失 en 和 en 的 情形 . 我 们 可 以 分 
别 单独 地 利用 后 验 分 布 fni X, mna. ho?) 和 f(rnailX.mn.,0?). TE Gibbs 抽样 
中 , 这 意味 着 我 们 一 次 抽取 一 个 缺失 值 . 

因为 zx 和 nua 在 时 间 序 列 中 是 相关 的 , 所 以 在 Gibbs 抽样 中 更 愿意 联合 地 
抽取 它们 . 当 连 续 缺 失 值 的 数量 很 大 时 尤其 如 此 .如 果 缺 失 值 的 数量 很 小 , 则 一 次 
抽取 一 个 缺失 值 可 进行 得 很 好 . 

注释 : ”在 前 面 讨论 中 , 我 们 假定 及 一 p 尖 1 Hht+p<n. 如 果 几 接近 于 样本 
时 间 区 间 的 终点 , 则 在 线性 回归 模型 中 可 以 利用 的 数据 点 的 数量 必须 调整 . oO 
12.6.2 ”异常 值 的 识别 


(12.14) 式 中 可 加 异常 值 的 识别 在 MCMC 框架 中 变 得 很 直接 . 除了 具有 相似 
大 小 的 一 堆 可 加 异常 值 的 情形 , McCulloch and Tsay (1994) 的 简单 Gibbs 抽样 运行 
都 很 好 . 参见 Justel, Pena and Tsay(2001). 我 们 再 次 利用 AR 模型 来 说 明 这 个 问 
题 . 当 利 用 Metropolis-Hasting 算法 或 格子 Gibbs 抽取 非 线 性 参数 时 , 此 方法 同样 
很 好 地 应 用 于 其 他 的 时 间 序 列 模型 . 
假定 观测 到 的 时 间 序 列 为 vu. 它 可 能 包含 位 置 和 大 小 都 未 知 的 一 些 可 加 异常 
值 . 我 们 将 ye 的 模型 写 为 
Wem +a, t—1, n, (12.18) 


其 中 (0,) 是 独立 的 伯 努 利 随 机 变量 序列 , 满足 P(5. = 1) = e, P(e =0) 1-5, A 
< 是 0 到 1 之 间 的 常数 , {PB} 是 来 自给 定 分 布 的 一 个 独立 随机 变量 序列 . 另外 , x, 
是 无 异常 值 的 AR(p) 时 间 序 列 

Lt = Q0 + dizi +--+ Vip at, 
其 中 {as} 是 均值 为 0、 方 差 为 o? 的 高 斯 白 噪声 , 虽然 这 个 模型 看 起 来 复杂 , 但 是 
它 允 许可 加 异常 值 在 每 个 时 间 点 发 生 . 每 一 个 观测 是 异常 值 的 机 会 为 <. 

在 模型 (12.18) F, BATA n 个 数据 点 , 但 是 有 2n 十 pb 十 3 个 参数 . 即 , 9 — 
(os » bp)’, 6 = (di , On)’, B — (Birt Bn)’, o? Mle. 二 值 参数 6, h e 控制 ， 
8, 由 指定 的 分 布控 制 . 参数 5 与 B 是 利用 数据 扩张 的 思想 引进 的 ,56, 表示 在 时 刻 
t 异常 值 出 现 或 不 出 现 , 而 B, 表示 当时 刻 t 异常 值 出 现时 它 的 大 小 . 

假定 先 验 分 布 为 

$ ~ N (po, Xo), 3 "Xp E~ beta(yı; y2); Be ~ N(0,£?); 
其 中 超 参 数 是 已 知 的 . 这 些 是 共 辆 先 验 分 布 . 为 了 对 具有 异常 值 识别 的 模型 估计 实 
施 Gibbs 抽样 , 我 们 需要 考虑 条 件 后 验 分 布 : 

F(P|Y,6, 8,07),  f(On|¥,b-n,8,0,07), f(BhlY, 6,B_n, 6, 0), 

f(alY,6), .f(e*|Y, 4, 8), 
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这 里 1 < h < n,Y 表示 数据 , 9_; 表示 剔除 0 的 第 i 个 元 素 后 的 向 量 . 
在 已 知 6 Al B 的 条 件 下 , 没有 异常 值 的 时 间 序 列 可 以 通过 m, = v, — 0,0, 得 到 ， 
数据 中 关于 o 的 信息 包含 在 它 的 最 小 二 乘 估计 


n + n 
$= ( "je iata) ( Y. sin) 


t=p+ 1 t= p+l 


中 , 其 中 ayy = (1, Te- ,zi_p)' H b 服从 多 元 正 态 分 布 , 均值 为 o, 协 方差 矩 
阵 1 
$- ^( s> — | 


t—p--1 
因此 o 的 条 件 后 验 分 布 是 多 元 正 态 的 , 均值 p. 和 协 方差 矩阵 X. 由 (12.9) 式 给 
出 , 其 中 用 由 代替 8, rs 代替 ros. 类 似 地 , o? 的 条 件 后 验 分 布 是 逆 卡 方 分 布 , BU 
UN + 326 54107 ; 
— zs Xetai 
其 中 ay — Lr o, C= Y= à. 
Sn 的 条 件 后 验 分 布 可 以 如 下 得 到 .首先 , 5 仅仅 与 (uj BY us (03) 72, 
有 关联 , 其 中 , jh o RI o2. 更 具体 来 讲 , 我 们 有 


r;—yj—0j8; jh. 

其 次 , 可 以 假定 zs 有 两 个 可 能 的 值 . 如 果品 = 1, W za = ys — Br. 否则 ， 

ra yh. FED 
wj =t} — bo — BT ~" — Óprj 4j — hh p, 

HPF j Ah, Wat =a; A oh = yn. zh 的 两 个 可 能 取 值 给 出 了 下 列 两 种 情形 . 

情形 IT 6, = 0. 这 里 第 h 个 观测 不 是 一 个 异常 值 且 ; = yy = zn， 从 而 对 
j=hħ h+p, wj =a; 换血 话说 , RNA 

Wj ~ N(0,07), j=h,:.,h+p. 


情形 1 64 =1. 现在 第 hh 个 观测 是 一 个 异常 值 且 0; = yn = en + Bn, 此 时 前 
面 定义 的 wy 被 On GAT. 事实 上 , 我 们 有 


wh ~ N(Br;0°), Wi ~ N(—96j-nDn, a), j =h-+ I, n wh TP. 


如 果 我 们 定义 vo--1H wi = Qi, i =1,---,p, WH j = A4+1,---,h+p, 
wj ~ N(=Wpj-hBh: 0°). 
根据 前 面 的 讨论 , 我 们 可 以 概括 如 下 : 
情形 1 以 概率 1— 6,0, = 0. 这 种 情形 下 , 对 7 =h… uh pw; ~ N(0,07); 
情形 1 中 以 概率 c, ôn = 1, XX HOM. j= h, A+ pw;  N(—wj- nn. o?). 
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因为 有 mw 个 数据 点 , 所 以 j 不 能 大 于 n. & m= min(n,h+p), 从 而 6, 的 后 验 分 布 
为 
P(6n —1lY,6 4,8, 0.0?) 
B eexp|— Eyed (wi + jn)? / (20?)] 
"&exp[- Een (uy + jn Pn /(209)] + (1 — €) exp[- on, uS /(202)] 
(12.19) 
此 后 验 分 布 仅仅 是 比较 两 种 情形 下 似 然 函数 的 加 权 值 , 而 权重 是 每 种 情况 的 概 

率 . 
最 后 , B 的 后 验 分 布 如 下 . 

e. WR ön — 0, W yj 不 是 一 个 异常 值 , AL B; ~ N (0, £2). 

e 如 果品 — 1, W yn 由 大 小 为 Bi 的 异常 值 污染 . 前 面 定义 的 变量 wj 包含 了 Bh 
的 信息 , j-—h,h--1,---,min(A +p,n). ARG, 对 了 = 有 hh 十 1,… ,min(h 十 
pn) 我 们 有 wy ~ N(-vj--nGn.o?). 该 信息 可 以 放 进 如 下 一 个 线性 回归 的 框 
架 中 : 

wj =—pi-hbr taj; J=h,h+1,---,min(h+p,n). 
因此 , 这 个 信息 被 嵌入 到 最 小 二 乘 估计 


Zsh —Pj-hWyj 
D428 -Wih i 

中 , 它 是 均值 为 Ba 方差 为 En V2. ,) KESSA. 由 结果 1, B 的 后 验 分 布 

是 均值 为 8;. 752878 o2. HESA, 其 中 

-(32jsa — Vj-nw;)€" 23. asc gre 

+ (ewe 0 oF Oe 

例 12.2 ”考虑 固定 期 限 为 3 年 期 的 美国 国库 券 利率 的 周 变化 序列 . 时 间 区 间 为 从 

1988 年 3 月 18 日 至 1999 年 9 月 10 日 ,共有 600 个 观测 值 . 利率 以 百分比 表示 ， 

且 为 例 12. 1 中 响应 变量 cu 的 子 序 列 . 图 12-2a 给 出 了 该 时 间 序 列 的 时 间 图 .如 


果 对 序列 采用 AR 模型 , 则 其 PACF( 偏 自 相 关 函 数 ) 建议 使 用 一 个 AR(3) 模型 , B. 
我 们 得 到 


C3t 三 U.227c3t1 十 0.006c3s t-32 + 0.1 14c3 4-2 + ap, ô? = 0.012 8, 


其 中 系数 的 标准 误差 分 别 为 0.041, 0.042 和 0.041. 残 差 的 LB 统计 量 为 Q02) = 
11.4, 它 在 5% 水 平 下 不 显著 . 

下 一 步 利 用 Gibbs 抽样 来 估计 这 个 AR(3) 模型 并 同时 识别 可 能 的 可 加 异常 值 . 
所 用 的 先 验 分 布 为 


$ ~ N(0,0.2513). 


B, = 


m, = min(h + p, n), 


B, = 


vA 5 x 0.002 56 
a? 2 g? € X5» N=5, y=95, £*—0.1, 
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其 中 0.002 56 ~ 67/5 H E = 962， 可 加 异常 值 的 期 望 个 数 为 5%， 利用 初始 值 
e = 0.05, a? = 0.012, $1 = 0.2, ġa = 0.02, 加 = 0.1, 我 们 运行 Gibbs 抽样 1 050 个 
迭代 , 但 是 将 前 50 MARMARA. 利用 系数 的 后 验 均值 作为 参数 估计 , 我 们 得 
到 拟 合 的 模型 ， 


c3 = 0.252¢3 4-1 + 0.003c3 4-2 + 0.11003, 2 +a, 67? = 0.011 8, 


其 中 参数 的 后 验 标准 误差 分 别 为 0.046, 0.045, 0.046 和 0.000 8. 这 样 , Gibbs 抽样 产 
生 的 结果 与 最 大 似 然 方 法 的 结果 很 相似 .图 12-2b 显示 了 可 加 异常 值 的 每 一 个 观 
测 的 后 验 概率 的 时 间 图 , 且 图 12-2c 画 出 了 异常 值 大 小 的 后 验 均 值 图 形 ， 由 概率 图 
nf UL, 某 些 观察 值 是 异常 值 的 概率 很 大 . 特别 地 ,上 = 323 的 概率 为 0.83, 相应 的 异 
常 值 大 小 的 后 验 均 值 为 —0.304. 当 cy 从 0.24 变化 到 -0.34( 即 大 约 是 两 星期 内 周 
利率 降低 0. 6% ) AY, 这 个 点 对 应 于 1994 年 5 H 20 日 .异常 值 的 第 二 个 最 高 后 验 
概率 的 点 为 上 = 201, 对 应 于 1992 年 1 月 17 日 . 列 出 的 后 验 概率 为 0.58 且 估 计 的 
异常 值 大 小 为 0.176. 在 第 二 个 点 , cat 从 一 0.02 变化 到 0.33, 对 应 于 周 利率 的 一 个 
KA 0.35% 的 跳跃 . 


(a) 利率 的 周 变 化 


c3t 


1988 1900 1992 1994 1996 1998 2000 
年 


(1) 异常 值 的 后 验 概率 


prob 


0.0 —— Aereo 
19585 1990 1992 1994 1996 1998 2000 


年 
(c) 异常 值 大 小 的 后 验 均值 


mag 
i AD TC RN 
Bro ei 


1088 1991 1992 1994 1996 1998 2000 
年 
图 12-2 HEMRA 3 年 期 的 美国 国库 券 利率 的 周 变 化 序列 时 间 图 , 时 间 区 间 是 从 1988 年 3 
月 18 日 至 1999 年 9 月 10 A: (a) BGR; (b) 异常 值 的 后 验 概率 ; (ce) 异常 值 大 小 的 
后 验 均值 . 估计 基于 1 050 个 近代 的 Gibbs 抽样 , 但 前 50 个 迭代 被 删 去 了 
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注释 : ”通过 Gibbs 抽样 的 异常 值 识别 要 求 高 强度 的 计算 , 但 此 方法 对 模型 参 
数 和 异常 值 实施 了 一 个 联合 估计 . 而 传统 的 异常 值 辨 识 方法 需要 将 估计 和 辨识 分 
JF. 它 在 计算 上 更 快 , 但 是 当 存 在 多 个 异常 值 时 可 能 产生 错误 的 辨识 . 对 于 例 12.2 
中 的 数据 , SCA 程序 也 识别 了 tt 上 = 323 fo t = 201 作为 两 个 最 显著 的 可 加 异常 值 . 
所 估计 的 异常 值 大 小 分 别 为 —0.39 和 0.36. 口 


12.7 ”随机 波动 率 模型 


MCMC 方法 的 一 个 重要 的 金融 应 用 是 估计 随机 波动 率 模 型 ， 参见 Jacquier, 
Polson and Rossi (1994) 及 其 参考 文献 . 我 们 从 一 个 1 维 随机 波动 率 模型 开始 HE 
产 收益 率 re 的 均值 和 波动 率 方程 为 


ri = Bo + Byry +++ BpEp +t; a = V MEt, (12.20) 


In hr = Qo + 01 In Ape + Ut, (12.21) 


其 中 {zali = 1,---,p} 是 时 刻 t+ 一 1 可 以 得 到 的 解释 变量 , 0; 是 参数 , {e} 是 均值 
为 0、 方差 为 1 Meares, (oL) 也 是 高 斯 白 噪 声 序列 , 其 均值 为 0、 方差 
AJ o2, H {e} 和 {ww} 是 独立 的 . 用 对 数 变 换 以 保证 对 所 有 t, hi 是 正 的 . 解释 变量 
zit 可 能 包含 收益 率 的 延迟 值 (如 zi = rii). 在 (12.21) AF, 我 们 假定 la| < 1 
使 得 对 数 波动 率 过 程 In h 是 平稳 . 如 果 有 必要 , 可 以 对 mh 采用 更 高 阶 的 AR(p) 
模型 . 

记 均 值 方程 的 系数 向 量 为 8 = (o. B. Bp), 波动 率 方程 的 参数 向 量 为 w= 
(a9,0),07)'. 假如 R= (ri ,rn)' 是 观测 到 的 收益 率 集合 , X 是 解释 变量 的 集 
合 . H = (h, hn)! 表示 不 可 观测 的 波动 率 向 量 . 这 里 B 和 w 是 模型 的 “ 传 
统 ” 参 数 , 而 H 是 一 个 辅助 变 元 . 如 果 通 过 最 大 似 然 估计 法 对 模型 进行 估计 , 则 很 
复杂 , 因为 似 然 函 数 是 以 下 n 维 H 分 布 的 混合 : 

IRIX, p.w) = | 1(RIX,B, HIR \w)AH. 
然而 , 在 贝 叶 斯 框架 下 , 波动 率 向 量 五 由 扩充 参数 组 成 . 在 已 知 五 的 条 件 下 , 我 
们 可 以 关注 概率 分 布 函数 f(RIH,B) 和 f(A |o) 以 及 先 验 分 布 p(B,w). 假设 先 
验 分 布 可 以 被 分 解 成 p(B,w) = p(B)p(w), 即 均值 和 波动 率 方程 的 先 验 分 布 是 独立 


的 . 要 估计 (12.20) 式 和 (12.21) 式 中 的 随机 波动 率 , Gibbs 抽样 方法 就 涉及 到 从 以 
下 条 件 后 验 分 布 中 抽取 随机 样本 : 


f(8|R,X,H,w), f(H |R, X,8,w), f(w|R,X, B ,H). 
下 面 , 我 们 给 出 所 用 到 的 Gibbs 抽样 在 实际 应 用 中 的 操作 细节 . 
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12.7.1 一 元 模型 的 估计 


给 定 H, (12.20) 式 中 的 均值 方程 是 一 个 非 齐 次 的 线性 回归 方程 . 方程 两 边 同 
时 除 以 Vhr, 我 们 可 以 将 模型 改写 为 ; 


Tot = 2, ent = ly n, (12.22) 


其 中 rot = re/Vht 和 toe = Ti / Vht, Hz, = (1,216777 Ept)! 是 解释 变量 所 组 成 
的 向 量 . 假设 B 的 先 验 分 布 是 均值 为 By, 协 方差 矩阵 为 Ao 的 多 元 正 态 分 布 , W B 
的 后 验 分 布 也 是 多 元 正 态 分 布 , 且 均 值 是 B.、 协 方差 矩阵 是 AL. 这 两 个 量 可 以 像 
以 前 一 样 通过 结果 1a 得 到 , 它们 是 : 


A+ = 3 20425, +Ag’, B.—A. (>: LotT0,t + AA.) 1 


t=1 t=] 
其 中 , 如 果 rp 是 在 解释 变量 中 使 用 的 最 大 延迟 收益 率 , 则 和 式 可 理解 为 从 p+ 
开始 求 和 . 
波动 率 向 量 H 是 逐个 元 素 进行 抽样 的 ， 必 需 的 条 件 后 验 分 布 是 7(ju| 尽 , X, 
H_,,,w), 它 是 由 a, 的 正 态 分布 和 波动 率 的 对 数 正 态 分 布 产生 的 


Sf (ht |R, X, B, H 4.0) 

x f (ar lhe. re we B) fh haa w ) f (hesi |hes ww) 

x hy?” exp[—(re — 2,3)? /(2h;)]h,  exp[- (In hi — m)? /(20°)] 

«x hy? exp[- (ri — 248)? /(2h,) — (In he — px)? /(207)], (12.23) 


其 中 j= [oo(1— 01) + ay (In heyi + In A4 3)]/(1 + a?) H o? = o2/(14- a2). 这 里 我 
们 使 用 了 以 下 性 质 : (a) ai |he  N(0. he) ; (b) In hy [Ina 1 ~ N(ao +01 In /u 1,02); 
(c) In heya |in he ^ N(ao +a In hy, 07); (d) din hi = hy !dh,, 其 中 d 表示 差分 算 子 ; 
(e) 等 式 


(a —a)?A + (x —b)?C = (z — c (A - C) + (a— b ACJ(A + C), 


Hp e 一 (Aa + Cb)/(A4- C), 假定 A+ C A 0. 这 个 等 式 是 Box and Tiao(1973, P 
418) 中 的 引 理 1 的 一 个 纯 量 版 本 . 在 我 们 的 应 用 中 , A = 1,a = oo Inh, 1,C = a? 
AL b = (nj 一 ao)/ea (a—b)2?AC/(A+ C) 不 包含 随机 变量 h, 从 而 在 条 件 后 验 
分 布 的 导出 中 被 积 掉 了 . Jacquier, Polson 和 Rossi(1994) 用 Metropolis 算法 来 抽取 
ht 的 样本 . 本 节 我 们 用 格子 Gibbs 抽样 , E h 的 取 值 范围 是 ry 的 无 条 件 样本 方差 
的 倍数 . 

为 了 抽取 w 的 随机 样本 , 我 们 将 参数 分 解 为 a= (o9, 01)' 和 o2. w 的 先 验 分 
布 也 可 相应 地 分 解 [ 即 , p(w) = p(a)p(o2)]. 我 们 需要 的 条 件 后 验 分 布 如 下 给 出 . 
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e f(a|Y. X, H.8,02) = f(a|H, c2): 给 定 H, Inh 服从 AR(1) 模型 . 因此 ， 
在 前 面 两 部 分 讨论 的 AR 模型 的 结果 也 可 在 这 里 应 用 . 特别 地 , 如 果 a 的 先 
验 分 布 是 均值 为 aos WIREH Co 的 多 元 正 态 , 则 f(a | H, o2) 是 均值 为 
a. WIZE C. 的 多 元 正 态 , A 


Qut cone +05", aC, (o DR P C; as) ` 
其 中 z = (1, In h, s. 
e f(a} |Y, X, H, B, a) = f(o?|H, a): 给 定 HA a, 我 们 可 以 计算 w= nh, — 
ao 一 aa jn hu 4,1 — 2, n. 因此 , 如 果 o2 的 先 验 分 布 是 (mA)/o? ~ x2,, 则 zz 
的 条 件 后 验 分 布 就 是 一 个 自由 度 为 m+ n — 1 Be 75 ^, 即 . 
mA-F Ya UE 
of 
注释 1: AX (12.23) 对 于 1 <t<n 成 立 , Kon 是 样本 量 ， 对 于 两 端的 
数据 点 hy 和 hn, 需要 一 些 修正 . 一 个 简单 的 方法 是 假设 hi 是 固定 的 , 这 样 对 hy 
的 抽样 就 从 二 2 PAG. SET t =n, 利用 结果 Ian ~ Nao +a Infin, 02). 或 者 ， 
我 们 可 以 利用 lings 的 预测 和 对 ho 的 反 向 预测 , 并 且 继续 应 用 公式 . 因为 hn 是 所 
关心 的 变量 , 我 们 运用 在 预测 原点 n — 10 的 向 前 2 步 预测 来 预测 A. HRB 
(12.21), Any. 的 预测 就 是 


2 
~ Xm+n-i: 


În-1(2) = ao +a (&o + ai In ha. .,). 
对 ho 的 反 向 预测 是 基于 模型 的 时 间 可 逆 性 
(Inh, — n) = oi (In hi — 9) + tt, 
RP = oo/(1 — 01) $ |os| < 1. 反 向 序列 的 模型 是 
(Inh, — 1) = a4 (In hii — 7) + 07, 


其 中 {vt} -AAE FAA 02 6 BECA HEP AES FR, 在 4 二 2 点 对 hio 


的 两 步 反 向 预测 就 是 k 
ha(—2) = af (ln ho — n). " 


注释 2; ”也 可 以 通过 使 用 在 AR(1) 模型 的 一 个 缺失 的 值 的 结果 来 得 到 (12. 
23) A (参考 12.6.1 节 ). 具体 来 讲 , 假定 Inh 是 缺失 的 . 对 于 AR(1) 模型 (12.21)， 
这 个 缺失 值 跟 In hei Fo ln hepi 相关 联 (1 <t <n). 由 模型 我 们 有 


In h, = ago + o4 In hti + ay. 
AX ye = ay + arya, te — 1 Fo b = — tt, 我 们 得 到 


Ye = Zr ln he by. (12.24) 
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接 下 来 , 由 
In /,44 = ag + a3 In hy + ati, 


我 们 定义 W+ = ln hti — Qo, (41 = 01 Fo biyi = ary 得 到 


Vti = moa In hta + 5g. (12.25) 


(12.24) 式 和 (12.25) 式 构成 一 个 特别 简单 的 含 两 个 观测 值 和 一 个 未 知 参 数 Inhi 的 
线性 回归 . 值得 注意 的 是 , by 和 bua 有 相同 的 分 布 , 因为 一 at 也 是 服从 N(0, 02) 
的 . Inh, 的 最 小 二 乘 回归 就 是 

Tiye + Tey iYex1 _ oll — 01) + 4 (In heya + In n- 1) 

zd 5a l4 oi 

它 正好 是 在 (12.23) AP Ini, 的 条 件 均值 . 另外 , 这 个 估计 服从 正 态 分 布 , 且 均 值 是 
Inhi 方差 是 02/(1 二 a3), (12.23) XH a, ~ N(0, he) Fo Inhi ~ N [In hy, 02 /(1+02)] 
的 简单 相 乘 再 加 上 一 个 变换 din hy = hy dla. 对 于 Inh, 这 个 回归 的 方法 可 以 很 容 
易 地 推广 到 其 他 AR(p) 模型 . 我 们 使 用 这 个 方法 并 且 假设 {h} | 对 一 个 随机 波 


inh, = 


动 率 AR(p) 模型 是 固定 的 . 口 
注释 3: hy 的 初始 值 可 以 通过 对 收益 率 序 列 拟 合 第 3 章 的 波动 率 模 型 来 得 
到 . 口 
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12-3 M 1962 Æ 1 月 到 1999 4€ 12 月 的 S&P500 指数 的 月 对 数 收益 率 的 时 间 图 


例 12.3 考虑 从 1962 年 1 月 到 1999 年 12 月 的 S&P500 指数 的 月 对 数 收 益 率 ， 
Jk 456 个 观测 值 . 图 12-3 给 出 了 收益 率 (以 百分比 形式 给 出 ) 的 时 间 图 . m ROG iA 
序列 采用 GARCH 模型 的 话 , 我 们 得 到 一 个 高 斯 GARCH(1,1) 模型 

r, = 0.658 + ar; a, = y hie, 

hy = 3.349 + 0.086a7_, + 0.735h4_1, (12.26) 


12.7 随机 波动 率 模型 ”495 


其 中 系数 的 t- 比 全 部 都 大 于 2.52. 标准 化 残 差 及 其 平方 序列 的 Ljung-Box 统计 量 
不 能 表明 模型 是 不 充分 的 . 
下 面 , 考虑 随机 波动 率 模型 


Te = H + at, ae = V lEt, 


In hy = ag + 04 In h4 4 + t, (12.27) 


其 中 w 是 独立 同 N(0,02) 分 布 的 . 为 了 应 用 Gibbs 抽样 , 我 们 使 用 先 验 分 布 
pp ~ N(0,9),a@~ NIao,diag(0.09,0.04)]， SM Met 


a2 
其 中 ao = (0.4, 0.8). 对 于 初始 参数 值 , 我 们 使 用 对 {1u} 序列 拟 合 GRACH(1,1) # 
型 (12.26) 时 的 拟 合 参数 , IFAS o? = 0.5 和 p= 0.06, 后 者 为 样本 均值 . 另外 , hi 
是 用 格 了 了 Gibbs 抽样 方法 使 用 500 个 格 点 抽样 得 到 的 , he 的 范围 是 (0, 1.5s?), 其 中 
s? 是 对 数 收 益 率 ny 的 样本 方差 . 

我 们 进行 5 100 2X Gibbs 抽样 , 并 且 丢 掉 最 初 的 100 次 抽样 结果 . 图 12-4 所 示 
的 是 4 个 系数 参数 的 先 验 和 后 验 密度 函数 . 所 用 的 先 验 分 布 相对 包含 的 信息 更 少 . 
后 验 分 布 特别 集中 在 4 和 02. 图 12-5 所 示 的 是 拟 合 波动 率 的 时 间 图 . 上 面 的 一 幅 
给 出 了 hi 在 每 个 时 间 点 的 后 验 均值 , 且 该 后 验 均 值 是 由 5 000 次 迭代 算出 的 . 而 
下 面 一 幅 给 出 了 GARCH(11) 模型 (12.26) 的 拟 合 值 . 两 幅 图 呈现 出 一 个 相似 的 模 
式 . 


2 
~ X5 


10 r^ 2.0 a E D E 10 

cel 

图 12-4 X4 S&P500 指数 的 月 对 数 收 益 率 数据 使 用 随机 波动 率 模型 时 参数 的 先 验 和 后 验 分 布 
密度 . 虚线 表示 先 验 , 实 线 表 示 后 验 , 它们 由 5 000 次 Gibbs 重复 抽样 得 到 ， 上 基体 细 
节 参 考 文字 部 分 


4 个 系数 的 后 验 均值 和 标准 误差 如 下 : 


0.0 0.5 
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参数 H ag [21] c2 
均值 0.836 0.831 0.685 0.265 
标准 误差 0.177 0.183 0.069 0.056 


o, 的 后 验 均值 是 0. 685, 比 Jacquier, Polson, and Rossi(1994) 使 用 S&P500 指 
数 的 日 数据 得 到 的 后 验 均值 要 小 . 但 是 它 证 实 了 波动 率 序列 的 强 依赖 性 . 最 后 , 我 
们 使 用 不 同 的 初始 值 进行 男 外 一 个 Gibbs 抽样 , 并 有 3 100 KER. 参数 的 后 验 均 
值 有 一 点 点 变化 , 但 是 u 的 后 验 均 值 序列 是 稳定 的 . 
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图 12-5 给 S&P500 指数 的 月 对 数 收益 率 数 据 所 拟 合 波动 率 的 时 间 图 . 时 间 区 间 是 从 1962 年 
到 1999 年 . 上 面 的 一 幅 给 出 了 Gibbs 抽样 h 在 每 个 时 间 点 的 后 验 均 值 , 上 且 该 后 验 均 
值 是 由 5 000 次 迭代 算出 , mg Pig 886514 f. GARCH(1,1) 模型 的 结果 


12.7.2 ”多 元 随机 波动 率 模 型 


本 一 小 节 用 第 10 章 的 Cholesky 分 解 来 研究 多 元 随机 波动 率 模型 .我 们 集中 
研究 一 元 的 情形 , 但 是 所 讨论 的 方法 对 更 高 维 数 情 形 同 样 适用 . 基于 Cholesky 分 
f. 将 收益 率 T, 的 新 息 C 变换 为 b, 满足 


bit = Git, bor = O21 — qzi bit, 
其 中 bo 和 qui 可 以 解释 为 下 面 线性 回归 模型 的 残 差 和 最 小 二 乘 估计 


azt = q21,£/01t + bat. 


a, 的 条 件 协 方差 矩阵 被 {g1 922.2} 和 (4214). 参数 化 为 


a 1 0 0 1 
11,4 (i2,t ^ gii. (121,4 l (12.28) 
0214. 022, qais 1 0 922, 0 1 


其 中 giie = Var (bir | 及 ) A brlba. 于 是 , 我 们 关心 的 量 为 {91t 9224) 和 {a2i 
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一 个 对 于 收益 率 向 量 Tp (rit, Tat)’ 的 简单 的 二 元 随机 波动 率 模型 如 下 : 


Tr = By + Biz, + at: (12.29) 
In giit = Qio + onlngi 1+ di i= 1,2, (12.30) 
qa1t = Yo + V1421,t—1 + Ur, (12.31) 


其 中 {ay} 是 一 列 无 序列 相关 性 的 高 斯 随机 向 量 , 其 中 均值 为 零 、 条 件 协 方差 矩阵 
D: 由 (12.28) 式 给 出 , Bo 是 一 个 二 维 的 常数 向 量 , rt 表示 解释 变量 , {011}, {va} 和 
{ut} 是 三 个 独立 的 高 斯 白 噪声 序列 , 满足 Var(vi) = o2, 和 Var(w) = o2. 555p, 
我 们 在 (12. 30) 式 中 使 用 对 数 变换 使 得 gi; 为 正 . 

* Gi — (9i... gin) G = [G1, G2] WI Q = (qoi1,..., q21,5,)'. 模型 (12.29) 一 
(12.31) 中 “传统 的 ”参数 是 8 = (8,,8,), wi = (0i9,01,02,)i = 1,2 Al y = 
(yo.71,02). TELKA Q,Gı G2 ATH Gibbs 抽样 法 估计 这 样 一 个 二 元 随 
机 波动 率 模型 , 我 们 使 用 前 一 小 节 一 元 模型 的 结果 和 另外 两 个 条 件 后 验 分 布 . 具体 
来 讲 , 我 们 可 以 抽 得 下 面 的 样本 

(1) Bo 和 8, 的 逐 行 样本 , 使 用 结果 (12.22) st. 

(2) gie, 使 用 方程 (12.23), 只 要 将 a 换 成 auw; 

(3) wi, 使 用 与 一 元 情形 同样 的 方法 , 只 是 将 a, BOR ayy. 

为 了 抽 得 wz 和 goo. 的 样本 , 我 们 需要 计算 boy. 而 这 是 很 容易 的 , 因为 给 定 扩 
充 参数 向 量 Q 后 , ba = aai — qaran. 进一步 , bo, 服从 正太 分布, 且 其 均值 为 0、 条 
件 方差 为 9224. 

下 面具 需要 考虑 条 件 后 验 分 布 


f(m|Q, o2), FIQ, w), f(qai4|A, G, Q_s Y); 


其 中 w = (yo) 是 (12. 31) 式 中 的 系数 向 量 , JE BL A 表示 a 的 集合 当 
R,X, By 和 B, 给 定 的 时 候 , 它 是 已 知 的 . Ae Q 和 o2, 模型 (12.31) 是 一 个 简单 
的 高 斯 AR(1) 模型 . 于 是 , 如 果 oo 的 先 验 分 布 是 均值 为 wo、 协 方 差 矩阵 为 Do 的 
一 元 止 态 分 布 , WA vo 的 条 件 后 验 分 布 也 是 二 元 正 态 的 , 且 均 值 为 w., 协 方差 矩 
阵 为 D,. 这 里 


一 2 212} 一 2x ze q 1 — 

BD m, = D, (Haath pus), 

其 中 z: = (Ligat). 类 似 地 , 如 果 o2 的 先 验 分 布 为 (mA)/o2 ~ x2. 那么 o2 的 
条 件 后 验 分 布 为 

mA + 5^, 9 Ue 2 

oC en 


u 
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其 中 Ut = q214 — Yo — ¥1921,t-1- 最 后 ， 


flant |A.G,Q 02.0) (12.32) 
x f (bze 1922, f (421,4 1421,41, 02.02 ) f (2141 191,4 07,02) 
x gop; exp[— (ae: — q21,4,a1:)* / (2922)] expl- (4214 — Ht)” /(207)], 


其 中 pe = [o — 91) + 03 (914i + 0214:))]/(1 + 92) $10? = o2/(12- 31). 一 般 地 ， 
p, 和 o? 可 以 通过 使 用 在 AR(p) 中 的 缺失 值 的 结果 来 得 到 . 可 以 证 明 (12.32) AX} 
于 qn. 有 闭 型 分 布 . 具体 米 讲 , (12.32) 式 的 第 一 项 (BE gz2 和 a, MAE, 
qua 的 条 件 分 布 ) 是 正 态 的 , 且 其 均值 为 at/ait、 方差 为 g224/at,. (12.32) 式 的 第 
二 项 也 是 正 态 的 , 其 均值 为 心 、 方 差 为 o. 于 是 , 由 12.3 节 的 结果 1, gaye 的 条 件 
后 验 分 布 是 正 态 的 , 且 均 值 为 /.,、 方差 为 o?, 这 里 


1 a? 14-41 14-42 a? a2: 
ALL +7, lis = 07 Li E rptu 1 
Os 922,t oy ei g22t it 


其 中 je 由 (12.32) 式 定义 . 

il 12.4 “本 例 研究 IBM 股票 和 S&P500 指数 的 月 对 数 收 益 率 数据 的 二 元 波动 
率 模型 。 时 间 区 间 是 从 1962 年 1 月 到 1999 年 12 月 ， 这 是 一 个 例 12.3 的 扩 
充 版 本 , MAT TBM 股票 数据 .网 12-6 所 示 的 是 这 两 个 收益 率 序列 的 时 间 图 . 
4 r, 一 (IBM',SP,)' .如果 采用 第 10 章 中 的 经 过 Cholesky 分 解 的 时 变相 关系 数 
GARCH 模型 , 我 们 得 到 模型 


(a) IBM 
2n 
4, i38 
z 0 
,8 —10 
一 20 
一 30 
1970 1980 1900 2000 
年 
(b) S&P500 指 数 
10 
8 ü frm 
5-10 
一 20 
1970 1980 1990 2000 
年 


图 12-6 M 1962 年 到 1999 年 的 IBM 股票 和 S&P500 指数 的 月 收益 举 
对 数 收 瘟 率 的 时 间 图 (a) IBM JESS; (b) S&P500 指数 
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Tt = Bo + ai, (12.33) 
114 = QI10 十 ea1911 1 + 01202 , 4, (12.34) 
224 = O29 十 2101 4—1; (12.35) 
q21, = Yo; (12.36) 


其 中 估计 及 其 标准 误差 由 表 12-2a 给 出 , 为 了 比较 , 我 们 使 用 与 (12.33) 式 同样 的 均 
值 方程 和 -个 与 (12.34) 一 (12.36) 式 相 似 的 随机 波动 率 模型 , 波动 率 方程 是 


In gm 一 ao 十 aim gat i++ Var(vu) = o2,, (12.37) 
In g22 = aao + ver, Var(v2at) = 0 (12.38) 
qna you. Var(u) = o2. (12.39) 
使 用 的 先 验 分 布 是 


Bio ~ N(0.8, 4), Q, ~ N [(04, 0.8)’, diag(0.16, 0.04)], Qo() ~ N (5, 25), 


JOXU0l 4 SUS a 5x03 4 


~ N(O.4, 0.4 rw ^ y2. As yd. 
Yo (0.4, 0.4), oF, X10 ci X5: o2 X5 


这 些 先 验 分 布 相对 来 说 包含 的 信息 更 少 . 我 们 进行 Gibbs 抽样 1 300 UREA, 
但 是 丢掉 前 300 次 的 迭代 结果 . gae 的 随机 样本 是 用 400 个 格 点 的 格子 Gibbs 抽样 
抽 得 的 , 抽样 区 间 为 [0, 1.557], 其 中 s? 是 对 数 收 益 率 rw 的 样本 方差 . 表 12-2b 给 
出 了 二 元 随机 波动 率 模型 的 “传统 ” 参数 的 后 验 均值 和 标准 误差 . 

表 12-2 IBM 股票 和 S&P500 指数 的 月 对 数 收益 率 数据 的 二 元 波动 率 模型 估计 . 时 间 
区 间 是 从 1962 年 1 月 到 1999 年 12 H^. 
(a) 带 时 变 自 相关 系数 的 二 元 GARCH(1,1) 模型 


参数 foi Boa œo at a12 20 O21 Yo 
估计 1.04 0.79 3.16 0.83 0.10 10.59 0.04 0.35 
标准 差 0.31 0.20 1.67 0.08 0.03 0.93 0.02 0.02 
. (b) 随机 波动 率 横 型 
参数 Boi Boa a1 æj oy cz20 92. ^o 0 
后 验 均值 0.86 0.84 0.52 0.86 0.08 1.81 0.39 0.39 0.08 
besito 0.30 0.18 0.18 0.05 0.03 0.11 0.06 0.03 0.02 


2 随机 波动 率 模型 基于 1 000 次 迭代 Gibbs 抽样 , 迭代 总 次 数 为 1 300 次 . 


为 了 检验 Gibbs 抽样 的 收敛 性 , 我 们 运行 此 过 程 若干 次 , 每 次 用 不 同 的 初始 值 
和 不 同 的 迭代 次 数 , 结果 是 稳定 的 . 图 12-7 描 出 了 两 个 不 同 Gibbs 抽样 过 程 的 各 
种 量 的 散 点 图 . 第 一 个 Gibbs 抽样 是 基于 300 + 1 000 YE; 第 二 个 Gibbs Hh 
样 是 基于 500 十 3 000 GENIS, 其 中 M 十 N 表示 一 共 进 行 M 十 N 次 迭代 , 但 
是 将 丢掉 前 M VERA. 散 点 图 分 别 对 应 于 911,t,922,t,921,1;922,4,02, 的 后 验 
均值 和 相关 系数 po. 在 每 幅 图 上 添加 直线 y — x 是 为 了 表现 后 验 均 值 的 相近 程 
KE. Gibbs 抽样 结果 的 稳定 性 是 显然 的 . 
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Bd 12-7 给 IBM 股票 和 S& P500 指数 的 月 对 数 收 益 率 所 建立 的 二 元 随机 波动 率 模型 的 两 种 不 
同 的 Gibbs 抽样 的 各 种 统计 量 的 后 验 均 值 的 散 点 图 . X- 轴 表 示 基 于 5004-3 000 次 
迭代 的 结果 , y- 轴 表 示 基 于 300--1 000 次 迭代 的 结果 . 记号 如 文中 所 述 


比较 “下 (12.33) 一 (12.36) 式 中 带 时 变相 关系 数 的 GARCIH 模型 和 随机 波 
动 率 模型 是 有 意思 的 . 第 一 , 如 所 料想 , 这 两 个 模型 的 均值 方程 在 本 质 上 是 一 样 的 . 
第 二 , 图 12-8 给 出 了 BM 股票 收益 率 的 拟 合 波动 率 的 时 间 图 ， 图 12-8a 是 对 应 
于 GARCH 模型 的 , 图 12.8b 给 出 了 随机 波动 率 模型 的 后 验 均 值 . 这 两 个 模型 呈现 
相似 的 波动 率 特征 : 他 们 呈现 出 波动 率 聚 集 现象 , 并 且 在 波动 率 中 有 一 个 上 升 的 趋 
3. f^i], GARCH 模型 生成 更 高 的 波动 率 峰 值 . 第 三 , 图 12-9 给 出 了 为 S&P500 
指数 收益 率 所 拟 合 波动 率 的 时 间 图 . GARCH 模型 在 1993 年 附近 产生 了 一 个 额外 
的 波动 率 峰 值 . 这 个 额外 的 峰值 没有 在 图 12-5 中 的 一 元 分 析 中 出 现 . 看 上 去 对 十 
这 个 特殊 的 例子 , 二 元 GARCH 模型 生成 的 是 一 个 假 的 波动 率 峰 值 . 这 个 假 的 峰值 
是 由 对 IBM 收益 率 的 依赖 性 引起 的 , 而 且 并 没有 在 随机 波动 率 模型 中 出 现 . 实际 
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上 , S&P500 指数 收益 率 用 二 元 随机 波动 率 模型 得 出 的 拟 合 波动 率 与 一 元 分 析 得 出 
的 结果 相似 . 第 四 , 图 12-10 给 出 了 拟 合 条 件 相关 系数 的 时 间 图 , 日 该 图 表明 两 个 
模型 有 本 质 区 别 . GARCH 模型 的 相关 系数 相对 平滑 而 且 是 正 的 , 且 其 均值 为 0.55 
和 标准 误差 为 0.11. 然而 , 由 随机 波动 率 模型 产生 的 相关 系数 在 不 同 的 月 份 有 显著 
的 不 同 , 并 且 其 均值 为 0.57、 标 准 误差 为 0. 17. 而 且 , 在 一 些 孤立 的 情况 下 相关 


系数 还 是 负数 . 这 个 差异 是 可 以 理解 的 , 因为 在 随机 波动 率 模型 
机 扰动 u. 
(a) 带 时 变相 关系 数 的 GAROH 


中 ， P21,t 包含 了 随 
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图 12-8 给 IBM 股票 月 对 数 收 益 率 数据 所 拟 合 波动 率 的 时 间 图 ， 时 间 区 间 是 从 1962 年 到 


1999 年 : (a) 带 时 变相 关系 数 的 GARCH 模型 ; (b) 运用 Gibbs 
E 
1 000 次 估计 出 来 的 随机 波动 率 模型 

(a) 带 时 变相 关系 数 的 GARCH 
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抽样 器 重复 迭代 300 


图 12-9 ”给 IBM 股票 和 S&P500 指数 月 对 数 收 益 率 数据 所 拟 合 相关 系数 的 时 间 图 , 时 间 区 
间 是 从 1962 年 到 1999 年 : (a) 带 时 变相 关系 数 的 GARCH 模型 :(b) 运用 Gibbs fii 


样 器 重复 迭代 300 十 1 000 次 估计 出 来 的 随机 波动 率 模型 
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注释 : Gibbs 抽样 估计 法 对 于 其 他 二 元 随机 波动 率 模型 同样 适用 . 但 所 需 的 
条 件 后 验 分 布 是 本 节 讨 论 的 条 件 后 验 分 布 的 推广 , 不 过 它们 基于 相同 的 想法 . oO 


(a) 带 时 变相 关系 数 的 GARGCH 
0.8 
Bu] A amg re er 
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È 04 
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图 12-10 给 S&P500 指数 月 对 数 收益 率 数 据 所 拟 合 波动 率 的 时 间 图 , 时 间 区 间 是 从 1962 年 
到 1999 Æ: (a) 带 时 变相 关系 数 的 GARCH 模型 ; (b) 运用 Gibbs 抽样 器 重复 和 迭代 
300 + 1 000 次 估计 出 来 的 随机 波动 率 模型 


12.8 ”估计 随机 波动 率 模型 的 新 方法 


本 节 讨 论 估计 随机 波动 率 模 型 的 另外 一 种 方法 .该 方法 利用 了 卡尔 曼 滤 波 框 
架 下 的 向 前 滤波 (forward filtering) 和 向 后 抽样 (backward sampling)(FFBS) 技术 来 
提高 Gibbs 抽样 的 效率 . 利用 混合 正 态 分 布 联合 抽取 波动 率 过 程 能 够 大 大 地 缩短 

计算 时 间 . 事实 上 , 该 方法 可 以 用 来 估计 许多 带 杠 村 效应 和 跳跃 的 随机 扩散 模型 . 
为 了 方便 陈述 , 我 们 将 一 元 随机 波动 率 模型 (12.20) 和 (12.21) 改写 为 如 下 形 

式 : ü 

re = 28 + agexp (2) €. (12.40) 
Ha = O2 + Th, (12.41) 


其 中 T = (l, Ei tue)"; B = (Go, ,+ Bou 0n > 0, {ze} 是 零 均值 对 数 波 动 
率 序列 , A {er} 和 (s) 是 二 元 正 态 分 布 序列 , 且 其 均值 为 0、 协 方差 矩阵 为 


s 1 Pon 
Pon O0; 


参数 p 是 e, 和 m 的 相关 系数 , 代表 资产 收益 序列 re 的 杠杆 效应 (leverage effect ). 
具有 代表 性 的 是 , 车 o 是 负 的 , 则 表示 负 收 益 率 , 这 往往 会 增 大 资产 价格 的 波动 率 . 

比较 模型 (12.20) 和 (12.21), 我 们 有 =, = Inh; — Ino? Ao? = exp(E[In^;]). 
BD, z, 是 均值 调整 后 的 对 数 波动 率 序列 ， 这 种 新 参数 化 表示 有 一 些 好 的 性 质 ， 例 
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如 , 波动 率 序列 co exp(z,/2) 永远 是 正 的 . 更 为 重要 的 是 , m E suus 的 新 息 并 且 与 
z 独立 ， 这 个 简单 的 时 间 移动 使 我 们 能 够 处 理 杠 杆 效应 . 如 果 假 定 (12. 41) 式 为 
Z = Qi 4 d- Ty, WW ey 和 7 不 可 能 相关 ， 因为 非 零 相关 系数 意味 着 (12. 40) 式 中 e, 
和 n, 是 相关 的 , 这 将 导致 辨识 性 问题 . 
注释 : 另外 , 可 以 将 随机 波动 率 模型 写 为 
rt = m4 + agexp (=) Et, 
Zt = QZ + My, 


AX (cm)! 与 以 前 一 样 , 服从 二 元 正 态 分 布 . 另外 还 有 一 个 等 价 的 参数 化 方式 : 
Tt, = xð + exp (+) et, 


Zt = Oz; +m, 

其 中 Ez? = o9/(1— a), RA O. O 

在 模型 (12.40) 和 (12.41) 中 , 波动 率 模型 的 参数 是 B, oo, a, p, o, Mz = 
(2 ,zn)', 其 中 n 为 样本 量 . 为 了 简便 , 假定 2 已 知 . 通过 MOMC 方法 估计 这 
些 参数 需要 其 条 件 后 验 分 布 . 接 下 来 , 我 们 将 讨论 所 需要 的 条 件 后 验 分 布 . 

(1) 给 定 z, co 和 正 态 先 验 分 布 , B 具有 与 12.7.1 节 相 同 的 后 验 分 布 , 只 是 把 
(12.22) 式 中 的 Vhr 用 cn exp(z,/2) RE. 

(2) 给 定 z 和 on, a 只 是 一 个 简单 的 AR(1) 系数 . 于 是 , 利用 近似 的 正 态 先 验 
分 布 很 快 可 以 得 到 a 的 条 件 后 验 分 布 , 参见 12.7.1 45. 

(3) E B 和 z, E X. v = (ri— 2,8) exp( 24/2) = oper. 于 是 {v} 是 一 列 独立 
同 分 布 的 正 态 随 机 变量 , 且 均 值 为 0、 方差 为 o3. 若 02 的 先 验 分 布 为 mA/o2 ~ X2 ， 
WW of 的 后 验 分 布 为 自由 度 为 m+n 的 逆 x? 分 布 , 即 


mA +Y v2 er 


2 m+n" 
90 


(4) 给 定 B, oo, z 和 a, 我 们 可 以 很 容易 地 得 到 二 元 新 息 bs = (em)! + — 
n. 很 快 可 以 得 到 (p.02) 的 似 然 函 数 为 


tlp,08) = T] f(b1|2)a|B|-"—0/2 exp (-ixws ^w) 


rx [52|-(n7)/2 exp E (= Y») , 


t=2 
其 中 tr(A) 表示 和 矩阵 A 的 迹 . 然而 ， 该 联合 分 布 非常 复杂 , 因为 pp 和 o 2 不 能 分 离 . 
我 们 采用 Jacquier, Polson, and Rossi (2004) 的 技巧 ， 将 协 方差 矩阵 进行 如 下 的 重 


新 参数 化 : 
l pa, l p 
== = i 
E | |. B 
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其 中 w = 02(1—p?). 容易 看 出 , |x|—-w H 


at Se 1 0 LP x 
w —¢ 1 Ü g w 0 0 


其 中 S 只 包含 p. 令 e= (Ezt ,en) A n = (Ez ,En) 为 模型 (12.40) 和 (12.41) 
的 新 息 , 则 似 然 函数 变 为 (只 保留 与 参数 有 关 的 项 ): 


(i, rei ——tr(SR)}, 
(p. waw exp ( 2 r( SR) 


其 中 R= 六 = (em) (en) 是 新 息 的 2 x 2 交叉 乘积 矩阵 ， 为 了 简便 , R 


们 使 用 共 胃 先 验 分 布 使 得 w 服从 超 参数 为 (yo/2,%4/2) 的 逆 伽 玛 (IG) 分 布 , 即 
w ~ IG(yo/2,51/2) 且 plo ~ N(0,w/2). 经 过 一 些 代数 运算 , (P,o) 的 联合 后 验 分 布 
可 以 分 解 为 正 态 分 布 和 逆 伽 玛 分 布 . 具体 来 讲 ， 


e ^ N[p,w/(2 + e'e)], 
Ha p= e'n/(2+e’e) H 
w ~ IG[(n + 1 +-y0)/2, (1 - mn — (e'n)?/(2 +e'e)}/2]. 
在 Gibbs 抽样 中 , 一 旦 得 到 io 和 w, 我 们 便 可 以 很 容易 得 到 p 和 02, 这 是 因为 
o2 =wt¢, p = plon 值得 注意 的 是 , 若 随机 变量 w 服从 IG(a, 8) 分 布 , 则 其 概 
率 密度 函数 为 
f(wla, 8) = IP -atl) exp (-£) , GA 


D(a) 
其 中 a>2 且 8>0. 
(5) 最 后 , 考虑 给 定数 据 和 其 他 参数 的 条 件 下 , 对 数 波动 率 z 的 联合 分 布 . 由 
(12.40) 式 , 我 们 有 (ry — 2h)? 


2 
a — exptit24J£,. 
c2 p( 1) t 


因此 , & y, = Inl(ri — z,8)*/o8]. RANA 
Wt = 2+ E}, (12.42) 


其 中 ef = In(e2). HF 22 ~ x2, At ef 不 服从 正 态 分 布 . 将 (12.42) 式 作 为 观测 方 
程 , (12.41) 式 作 为 状态 方程 , 我 们 就 可 以 得 到 状态 空间 模型 的 形式 , 只 是 ez 不 再 服 
从 正 态 分 布 . 参见 第 11 章 的 (11.25) 式 和 (11.24) 3X. 为 了 克服 非 正 态 带 来 的 困难 ， 
Kim, Shephard 和 Chib (1998) 利用 7 种 正 态 分 布 的 混合 来 逼近 ez 的 分 布 . 具体 来 
讲 , 我 们 有 


7 
FER) = So PiN (ui, 2), 
=) 
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其 中 pi, mi 和 wo? 由 表 12-3 给 出 , 也 可 以 参见 Chib, Nardari 和 Shephard (2002). 

为 了 说 明 近 似 的 充分 性 , 图 12-11 给 出 了 er 的 密度 函数 ( 实 线 ) 以 及 表 123 
中 给 出 的 7 种 正 态 分布 的 混合 的 密度 函数 (虚线 ). 这 些 密度 是 用 模拟 得 到 的 , 共有 
100 000 个 观测 . 由 图 可 以 看 出 , 7 种 正 态 分 布 的 混合 逼近 得 非常 好 ， 


表 12-3 7 种 正 态 分 布 


构成 3 概率 p, 均值 pri 方差 w? 
1 0.0U73U —11.4004 5.7960 
2 0.10556 —95.2432 2.6137 
3 0.00002 —0.8373 5.1705 
4 0.04395 1.5075 0.1674 
5 0.34001 —0.6510 0.6401 
6 0.24566 0.5248 0.3402 
JN 0.25750 一 2.3586 1.2626 


density 


-25 =20 -15 -10 一 5 0 5 
x 


12-11 log(y7) 的 密度 函数 ( 实 线 ), 7 MEA HAY 
密度 函数 (虚线 ). 结果 基于 100 000 个 观测 
为 什么 高 斯 状态 空间 模型 如 此 重要 呢 ? 答案 是 : 这 样 一 个 高 斯 模型 能 够 使 我 们 
联合 有 效 地 抽取 对 数 波动 率 序 列 z. 为 了 弄 清楚 这 一 点 , 考虑 卜 述 特殊 的 高 斯 状态 
空间 模型 , 其 中 ny 和 et 是 不 相关 的 ( 即 没 有 杠杆 效应 ): 


tei = ez + Tts m ~ia N(0,on), (12.43) 
Ut —Ct t tt et, €t nina. N(0, Hi) (12.44) 


其 中 , 假定 (ce, He) 取 表 12-3 中 的 (jw, m2)( 对 应 某 个 i), 这 将 在 后 面 看 到 . 对 于 这 
个 特定 的 状态 空间 模型 , 卡尔 曼 滤波 算法 如 下 : 


Ut = Vt — Yele—1 = 
Vi — Xa TH, 
—1 
Ztlt = 2t/t—-1 十 Xia V; Ut, 


= (12.45) 
Dit = Xa E Xa V, S 1s 
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如 十 Tt 一 023r, 
2 —o?Y,. + 82, 


其 中 Vi = Var(v) 是 页 在 给 定 Fea = (yn e ea) 条 件 下 的 向 前 1 步 预测 误差 
v, 的 方差 , zi 和 Xi 分 别 是 状态 变量 z 在 给 定 Fi 条 件 下 的 条 件 均值 和 条 件 方 
差 . 参见 第 11 章 中 对 于 卡尔 曼 滤波 的 讨论 . 


向 前 滤波 和 向 后 抽样 (FFBS) 


令 p(z|F.) 为 z 在 给 定 收益 率 数据 和 其 他 参数 条 件 下 的 条 件 联 合 后 验 分 布 , 这 
里 为 了 简便 , 条 件 集合 中 省 略 了 参数 . 我 们 可 以 将 分 布 分 解 为 


p(z|Fn) =P(z2, 23,**" ;Zn | Fn) 
—p(zs|Fn)p(2n-1l2n; F5)p(2n—2|2a- li 2ns Fg) va * p(22|23, CLIE FA) 
—p(zn|Fa)P(Zn-1|2n: Fn)p(2n-2|2n—1; Fy) +++ p(22|23, Fn), (12.46) 


最 后 一 个 等 号 成 立 是 因为 (12.43) 式 中 的 z 是 马尔 可 夫 过 程 , 因此 在 已 知 ze 的 
条 件 下 , a 与 nag > 1) 是 独立 的 . 
由 (12.45) 式 的 卡尔 曼 滤 波 知 , p(zn|Fn) ICAI, 且 其 均值 为 enno 772879 
Dain. 接 下 来 考虑 (12.46) 式 的 第 二 项 p(zn_1|zn, Fn). 我 们 有 
P(Zn-1|2n; Fa) = p(Zu—1ilZn; ) Fae Yn) = P(Zn—-1\2n, Facti Un), (12.47) 
其 中 Un — Un — Un|n—1 是 Un 的 向 前 1 步 预测 误差 . 由 (12.43) 式 和 (12.44) 式 的 状 
态 空 间 模 型 知 zn- 与 vn 独立 . 因此 
P(Zn—1|2n; Fan) = p(2s—1|2n; Fn—1)- (12.48) 
这 是 一 个 很 重要 的 性 质 , 因为 它 意 味 着 通过 第 11 章 的 定理 11.1, 可 以 由 在 给 定 Fa s 
条 件 下 Cp Ls 的 联合 分 布 来 推导 出 后 验 分 布 p(zu-1lzn: Fy): 首先 ， 在 高 斯 假定 
下 联合 分 布 是 二 元 正 态 的 . 其 次 , 在 给 定 Fari 的 条 件 下 , (zn-1, zn) 的 条 件 均值 和 
条 件 方差 可 以 很 容易 地 从 (12.45) 式 的 卡尔 曼 滤波 算法 中 得 到 . 具体 来 讲 , 我 们 有 


| Zn—1 | ~ N (| Zn—1|n—1 | | na-in OX 1|n-1 | (12.49) 
Zn F.a Zn|n—1 Q3, 1n-1 Dala- 
其 中 方差 可 以 通过 如 下 步骤 得 到 : (i) 在 (12.43) 式 两 端 同时 乘 以 zi; (ii) 取 条 件 


期 望 . 值得 注意 的 是 , (12.49) 式 中 所 涉及 到 的 所 有 量 都 可 以 由 卡尔 曼 滤波 得 到 . A 
此 , 由 定理 11.1, 我 们 有 


P(2n-1|zn, Fn) ~ N (Hh-1: 95-1). (12.50) 
其 中 


* E 一 上 
Hn—1 =2n-1|n—-1 T AEri- Enjin- = Zn|u—1): 
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ia a =U n-1\n-1 s i a 
jx PSK, 对 于 条 件 后 验 分 布 P(Zn—2|Zn-1, Fr), RANA 
D(25—2|25—1; Fg) = gl ts Ps. Un—1; Un) 
—p(zn-2|zn—1: Fn—2; Un—1; Un) 


—p(Zn-2|2n—1. Fn_2). 


因此 ， 与 前 面 一 样 ， 可 以 由 二 元 正 态 分 布 p(za 2, Zn i| Fp) 1838] ERE E E Fa). JM. 
般 地 , 我 们 有 


P(2t|2t41, Fn) = plzz Fe), 1<ten. 


此 外 , 由 卡尔 曼 滤波 , p(z, alf) 是 二 元 正 态 的 且 
| -x (| “i | | Yee Dee li (12.51) 
Zt-] E, Zt+ilt aX, Xa 


P(2e|Zt41, Fi) ~ N (uf, Df), 


因此 
LI 


其 中 ， 
Me = Zejt + Oe De uua — Zt), 
Ut = Ere — 07D? DP} 


t--1|t* 

前 面 的 推导 意味 着 , 我 们 可 以 通过 递归 方法 , 利用 由 卡尔 曼 滤波 得 到 的 已 知 量 
联合 抽取 波动 率 序 列 z. 也 就 是 说 , 给 定 初始 值 zijo 和 Dio, 利用 (12.45) 式 的 卡尔 曼 
滤波 将 收益 率 数据 向 前 推移 , 然后 利用 向 后 递归 的 方法 抽取 波动 率 序列 z 的 一 个 实 
现 . 此 方法 称 为 向 前 滤波 (forward filtering) 和 向 后 抽样 (backward sampling)(FFBS). 
参见 Carter and Kohn (1994) 以 及 Frühwirth-Schnatter (1994). 由 寺 波 动 率 序列 是 
序列 相关 的 , 故 联合 抽取 序列 更 加 有 效 . 

注释 : FFBS 方法 适用 于 一 般 的 线性 高 斯 状态 空间 模型 . 主要 思想 是 利用 模 
型 的 马尔 可 夫 性 和 状态 转移 方程 的 结构 , 使 得 

2(Si Se Fh) = p( SiS, Fi Vra Un) — n(S,|S,, 1, Fy), 
HPS, 是 t 时 刻 的 状态 向 量 , vo) 是 向 前 1 步 预测 误差 . 该 等 式 使 得 我 们 能 够 利用 
定理 11.1 推导 出 一 个 递归 的 方法 来 联合 抽取 状态 向 量 . 口 

再 回 到 随机 波动 率 模型 的 估计 . 如 同 在 (12.42) 式 中 一 样 , 令 y, = In[(r, 一 
ziB) /oil. 为 了 实现 FEBS. 我 们 必须 确定 (12.44) 式 中 的 e, 和 AL, 使 得 正 态 分 布 
的 混合 能 够 对 ez 的 分 布 提供 一 个 很 好 的 近似 . 为 此 , 我 们 用 一 歼 独 立 的 指示 变量 
{J} 来 扩充 模型 ， 其 中 对 于 每 个 t, I. YE {1,-+- SEF “PAY (A, 满足 P(L; =i) = pie 且 
Y pa — 1. 实际 中 , 在 已 知 (e) 的 条 件 下 , 我 们 可 以 按 如 下 方法 确定 w 和 H. 4 
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git = $y -—2-—Hn)/wi, i=l, T, 


其 中 jw 和 co; 分 别 是 表 12-3 中 所 给 出 的 正 态 分 布 的 均值 和 标准 误差 , 更 (.) 表示 标 
准 正 态 随机 变量 的 累积 分 布 函 数 . 概率 qu 是 给 定 y 和 z 的 条 件 下 , 五 的 似 然 函 
数 . 表 12-3 中 的 概率 p, 构成 了 五 的 先 验 分 布 . 因此 , 五 的 后 验 分 布 为 

piqit 
Lei pjdjt. 


我 们 可 以 利用 该 后 验 分 布 抽取 五 的 一 个 实现 .如 果 随机 抽取 是 n = 7, 则 定义 
a = pj, Hy = c. 综 上 所 述 , 在 已 知 收益 率 数据 和 模型 其 他 参数 的 条 件 下 , 我 们 利 
用 (12.43) 式 和 (12.44) 式 中 近似 的 线性 高 斯 状态 空间 模型 来 联合 抽取 对 数 波 动 率 
序列 z. 我 们 发 现 这 样 得 到 的 Gibbs 抽样 在 估计 一 元 波动 率 模型 时 是 有 效 的 . 

另 一 方面 , (12.42) 式 所 涉及 的 平 力 变换 不 能 保持 m 和 e, 的 相关 性 (如 果 有 的 
话 ), 这 使 得 (12.43) RA (12.44) 式 中 近似 的 状态 空间 模型 不 能 估计 杠杆 效应 . 为 
了 克服 这 个 不 足 ，Artigas 和 Tsay (2004) 建议 使 用 时 变 状态 空间 模 模 来 保持 杠杆 效 
应 . 具体 来 讲 , “4 p40 时 , 我 们 有 


MH = pay Et H: 


其 中 y 是 与 e, 独立 的 正 态 随机 变量 且 Var(nf) = 02(1 — p?). 于 是 (12. 43) 式 的 
状态 转移 方程 变 为 


Pi = bis. 


Ziyi = az + poy, Et HR. 
将 e, = (1/00) (rt — 2,8) exp( 2/2) RA, 我 们 得 到 


po, (Tr, — cB) , 
SS exp(—24/2) + nj (12.52) 


244 2 十 


—Gíz)-4 "jg 


其 中 Glz) = oz, + poy (ri — 2,8) exp(—2:/2)/80. 对 于 状态 变量 z 而 言 , 这 是 一 个 
非 线 性 转移 方程 . (12.45) 式 的 卡尔 曼 滤波 不 再 适用 . 为 了 克服 该 困难 , Artigas 和 
Tsay (2004) 用 时 变 线性 卡尔 曼 滤 波 来 逼近 该 系统 . 具体 来 讲 , (12. 45) 式 的 最 后 两 
个 等 式 改 为 

Zeit =G (Zye): 

nat —g(zu? Eije 十 ez p*), 
其 中 glz) = OG(x)/Oz\r=z,), 是 Gla) 的 一 阶 导数 在 半 滑 状态 ze 处 的 取 值 . 
例 12.5 为 了 演示 FFBS 方法 , 我 们 考虑 S&P500 指数 的 月 对 数 收益 率 , 时 间 区 间 
是 从 1962 年 1 月 到 2004 年 11 A, 共有 515 个 观测 . 图 12-12 给 出 了 对 数 S&P500 
指数 和 对 数 收益 率 的 时 间 图 原始 数据 来 自 雅 虎 金融 网 站 . 令 re 表示 月 对 数 收益 
率 . 我 们 考虑 两 个 如 下 形式 的 随机 波动 率 模型 
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Tt =H + 0oexp(zi/2) Et, Ermia N(0, 1), 
21411 =A +F Ne, T ^ia N (0,2). 


(E BUS. 1 中 , {st} 和 {m} 是 两 个 独立 的 高 斯 白 噪声 序列 . 也 就 是 说 , 该 模型 中 没有 
杠杆 效应 . 在 模型 2 中 , 我 们 假定 corr(er ne) = p, 这 代表 杠杆 效应 . 


(12.54) 


I 
a 
gt u 
1970 1980 1990 2000 
tp 
(b) 对 数 收 益 率 
0.1 
ae 
wW 0.0 
Boy 
—0.2 
1970 1980 1990 2000 
年 


图 12-12 月 S&P500 指数 的 时 间 图 , 时 间 区 间 是 从 1962 年 1 月 到 
2004 年 11 H: (a) 对 数 指数 序列 ; (b) 对 数 收益 率 序列 


我 们 通过 FFBS 方法 用 Matlab 的 程序 估计 模型 . 进行 了 2 000-48 000 次 Gibbs 
SEAN, 前 2 000 次 迭代 被 删 去 了 . 表 12-4 给 出 了 参数 估计 的 后 验 均值 和 后 验 标准 误 
Ze. 尤其 是 , 我 们 有 A= —0.39, 非常 接近 于 文献 中 经 常 看 到 的 值 . 图 12-13 给 出 了 
后 验 均值 和 被 估 波 动 率 的 时 间 图 . 如 所 料想 , 两 个 波动 率 序列 非常 靠近 . 与 例 12.3 
那里 的 序列 更 短 的 结果 相 比 ， 被 佑 波动 率 序列 呈现 出 相似 的 形式 和 相同 的 幅度 . 注 
意图 12-5 给 出 的 波动 率 是 对 数 收益 率 百 分 比 的 条 件 方差 , 而 图 12-13 是 对 数 收益 
率 的 条 件 标准 误差 . 


R 12-4 WF S&P500 指数 的 月 对 数 收益 率 , 利用 带 FFBS 算法 的 Gibbs 抽样 拟 合 随 
机 波动 率 模型 (12.54) 时 的 估计 ” 
参数 


it eo o On p 


带 杠杆 效应 
估计 0.008 1 0.076 4 —0.06 6 2.563 9 —0.389 2 
标准 误差 0.027 4 0.025 5 0.118 6 0.392 4 0.029 2 
不 带 杠杆 效应 
估计 0.008 0 0.077 5 一 0.061 3 2.582 7 
标准 误差 0.027 9 0.026 6 0.116 4 0.378 3 


a 结果 基于 2 000+8 000 次 Gibbs BEAR, 前 2 000 WERRIET. 
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(n) 带 杠 杆 效应 的 波动 率 序列 
0.25 


se 
m UIS 
E 

0.05 

1970 1980 1990 2000 
年 
(b) 不 带 杠杆 效应 的 波动 率 序 列 

0.25 
¥ 0.15 
35 

0.05 


1970 1980 1990 2000 


图 12-13 ”利用 随机 波动 率 模型 为 3&P500 指数 月 对 数 收 益 率 所 估计 的 波动 率 , 时 间 区 间 是 从 
1962 年 1 月 到 2004 年 11 H: (a) 带 杠 杆 效应 ; (b) 不 带 杠 杆 效应 


12.9 “马尔 可 夫 转 换 模型 


马尔 可 夫 转 换 模 型 是 又 一 个 用 MCMC 方法 比 用 其 他 传统 似 然 方法 有 更 多 优 
UT AREY AL. McCulloch 和 Tsay (1994) 讨论 了 一 个 Gibbs 抽样 方法 来 估 
计 在 每 一 个 状态 的 随机 波动 率 都 是 不 随时 间 变 化 的 模型 ， 他们 为 美国 实际 国民 生 
产 总 值 的 季度 增长 率 (已 做 季节 性 调整 ) 建立 了 一 个 对 不 同 的 状态 带 有 不 同 的 动态 
机 制 和 均值 水 平 的 Markov 转换 模型 , 并 用 他 们 的 方法 去 估计 , 从 而 得 到 一 些 有 趣 
的 结果 . 例如 , 在 经 济 扩张 期 和 经 济 紧缩 期 , 增长 率 的 动态 变化 有 明显 的 不 同 . 由 于 
本 章 关 注 的 是 资产 收益 率 , 故我 们 集中 考虑 模型 的 波动 率 转换 . 

假定 资产 收益 率 r 服从 一 个 简单 的 两 个 状态 的 转换 模型 .该 模型 有 不 同 的 风 
险 溢 价 和 不 同 的 GARCH 动态 机 制 : 

» By + Vinee, ht = 019 Harthi- Farna? E 8(— 1, 
"— \ Bavin + Viuen he = 029 +anhi-i d- 02202 4, 车 s =2, 
其 中 Qi -— v/hies, {ex} 是 均值 为 0. 方差 为 1 Fr EUR A IR 8 FS, 参数 Aij 满足 一 
些 正则 性 条 件 使 得 a, 的 无 条 件 方差 存在 .从 一 个 状态 到 另 一 个 状态 的 概率 转移 由 
下 式 确 定 


(12.55) 


P(s,=2|e-1:=1)=—e1 , P(s,—1|s,-1 = 2) = es, (12.56) 

这 里 0 < ei <1. 一 个 小 e; 意味 着 收益 率 序 列 倾向 于 在 同一 状态 i A, 期 望 
持续 时 间 为 1/e;. 对 (12.55) 式 中 的 待 识别 模型 , 我 们 假定 b > A, 使 得 状态 2 与 
更 高 的 风险 溢价 相 联系 . 这 并 不 是 一 个 关键 性 的 限制 , 因为 它 用 来 得 到 状态 的 唯一 
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标记 . 模型 的 一 个 特殊 情形 是 对 所 有 的 j, a1; = az;, 即 对 所 有 的 状态 都 假定 一 个 
GARCH 模型 . 然而 , 如 果 用 5; 代替 Bivi, 则 模型 (12.55) 简化 为 简单 的 马尔 可 
夫 转 换 GARCH 模型 . 

模型 (12.55) 是 一 个 马尔 可 夫 转 换 GARCH-M 模型 . 为 了 简便 , 我 们 假定 h 
的 初始 波动 率 是 给 定 的 , 其 值 等 于 x, 的 样本 方差 . 一 个 更 加 熟练 的 分 析 是 将 h， HE 
为 一 个 参数 , 并 与 其 他 参数 联合 估计 . 我 们 认为 在 大 多 数 应 用 中 固定 h 所 带 来 的 
效应 都 可 以 忽略 , 尤其 当 样 本 量 很 大 时 . 马尔 可 夫 转 换 GARCH-M 模型 的 “传统 * 
参数 为 B= (Bi, 83), a; = lio O41, O42)’ (i = 1, 2, 且 转 移 概 率 为 e 一 (el,ez)/. 状态 
向 量 S = (81, s2,… , sn) 包含 了 扩张 参数 . MRA hy, a, 和 状态 向 量 S, 则 波 
动 率 向 量 H = (hz, , hn)! 可 以 递 推 地 计算 . 

模型 (12.55) 中 收益 率 对 波动 率 的 依赖 蕴含 了 收益 率 也 是 序列 相关 的 , 这 样 该 
模型 在 收益 率 方面 具有 一 些 可 预测 性 . 然而 , 将 来 收益 率 的 状态 是 未 知 的 , T EL HA 
模型 产生 的 预测 必须 是 所 有 状态 配置 上 那些 预测 的 一 个 混合 . 这 通常 导致 未 来 收益 
率 的 点 预测 具有 较 高 的 不 确定 性 . 

下 面 考虑 估计 . 模型 (12.55) 中 的 似 然 函 数 是 复杂 的 , 因为 它 是 所 有 可 能 的 状 
态 配置 的 一 个 混合 . 然而 Gibbs 抽样 法 仅仅 要 求 如 下 的 条 件 后 验 分 布 


f(8|R., S, H, 1, (2), f(o;|R, S.H, jti), 


P(S|R, hy, 01,03), f(e:|S), $= 1,2. 
oR 是 观测 收益 率 的 集合 . 为 了 简便 , 我 们 利用 12.3 Mr EHICU A 36 28, 即 


Bi ~ N( Bio. 0%), €i ~ Beta(yin, Yiz). 


参数 ii 的 先 验 分 布 在 一 个 恰当 指定 的 区 间 上 是 均匀 的 . 因为 mi 是 似 然 函数 的 非 
线性 参数 , 我 们 利用 格子 Gibbs 抽样 来 抽取 其 随机 实现 . 均匀 先 验 分 布 简化 了 所 涉 
及 到 的 计算 . 下 面 给 出 了 条 件 后 验 分 布 的 细节 ， 

(1) A: 的 后 验 分 布 仅仅 依赖 于 处 于 状态 i 中 数据 , 定义 


Tue ri/Vh,, is, =i, 
= 0, 其 他 ， 
则 我 们 有 
Tit = Bi + E+, S, — d. 
因此 , 数据 关于 à, 的 信息 包含 在 ra 的 样本 均值 之 中 . 令 n = ( D ra) m 这 里 
的 求 和 是 对 处 于 状态 i 的 所 有 数据 点 求 和 , n 是 处 于 状态 i 的 数据 点 的 个 数 . 于 是 
8, 的 条 件 后 验 分 布 的 均值 为 如、 方差 为 o2, 其 中 
1 


1 
LE N. 
Ci, eio 


GF = Cin (nifi T Bio/ 05) ; #=1,2. 
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(2) 下 一 步 , 参数 wii 可 以 利用 格子 Gibbs 方法 逐个 抽取 . 给 定 hi, S, av 和 
Qiw(v 关 四, W oi; 的 条 件 后 验 分 布 并 不 对 应 于 一 个 著名 的 分 布 , 但 是 它 可 以 很 容易 
地 估计 , 因为 

Eis =i, Rift |) x -5 D [ine + E= AVI] 
其 中 ht 含有 oi. 我 们 对 一 个 恰当 指定 的 区 间 上 o4; 的 一 列 格 点 估计 这 个 函数 . 例 
如 0 入 oaii<1 一 aao2. 

(3) e, 的 条 件 后 验 分 布 只 涉及 S. 令 4 表示 在 S 中 从 状态 1 到 状态 2 转换 的 
个 数 , la 表示 从 状态 2 到 状态 1 转换 的 个 数 , 再 令 mi 表示 处 于 状态 i 的 数据 点 的 
个 数 , 则 由 共 思 先 验 分 布 的 结果 3, e; 的 后 验 分 布 是 beta(Tit + Li Jiz + ni — bi). 

(4) 最 后 , S 中 元 素 可 以 逐个 抽取 . > S- 表示 将 S PAM sj 之 后 得 到 的 癌 
ft. 给 定 5_; 与 其 他 信息 , 可 以 假定 s; 有 两 种 可 能 (BI s; = 1 或 s; = 2), HER 
条 件 后 验 分 布 为 i 

P(sjil) x [[/(aB)P(s;IS-.,). 
t=j 


概率 P(s; = i|S_;) = P(s; = ilsj_1;5j+1), i = 1,2, 可 以 由 (12.56) 式 的 马尔 可 夫 
转移 概率 计算 . 另外 , 假定 s; = i, 则 对 t > j, 可 以 递 推 地 计算 he. 相关 的 似 然 函 数 
用 L(s;) 表示 , 它 由 下 式 给 出 , 对 i = 1, 2, 


n n à 
件 后 验 分 布 为 


Pls; —1-) 
P(sj —1|s; 1,5511) L(55 = 1) 
P(s; 一 l|sj 3,8541) L(sj 一 1) + P(s; 一 2151, 8541) L(sj 一 2) 

从 而 状态 s; 可 以 利用 单位 区 间 [0, 1) 上 的 均匀 分 布 很 容易 抽取 . 

注释 : BAS el 和 ea 都 很 小 时 , sj 与 8j+1 是 高 度 相关 的 , 所 以 联合 抽取 几 
个 sj 更 加 有 效 . 然而 , 随 着 联合 抽取 状态 数量 的 增加 , 状态 涉及 的 计算 也 可 能 快速 
增加 ， 口 
fil 12.6 ”本 例 中 , 我 们 考虑 General Electric 公司 从 1926 年 1 月 全 1999 年 12 月 
的 月 对 数 收 益 率 , 共有 sss 个 观测 . 该 收益 率 用 百分比 表示 , 并 在 图 12-14a 中 给 出 ， 
为 了 比较 , 我 们 对 序列 以 一 个 GARCH-M 模型 开始 , 得 到 


re =0.182 V ht +at, 04 = V MEt: 
hi =0.546 + 1.740h,..4 — 0.775h4..2 + 0.02507. 1， (12.57) 
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ry 是 月 对 数 收益 率 , {e} 是 均值 为 0、 方差 为 1 的 独立 高 斯 白 噪 声 序列 . 所 有 参数 
的 估计 都 是 高 度 显著 的 , 其 p 值 都 小 于 0. 000 6. 标准 化 残 差 及 其 平方 的 LB 统计 
量 没 能 表明 任何 的 模型 不 充分 性 .这 重新 保证 了 风险 溢价 是 正 的 , 而 且 是 显著 的 . 
GARCH 模型 (12.57) 可 以 写 为 


(1—1.765B+0.775B?)a? = 0.546 + (1 — 0.025B)m, 


其 中 m =a? — hu, B 是 向 后 推移 算 子 , 满足 Ba? —a2 ,. 如同 第 3 章 中 讨论 的 , 上 
述 方程 可 以 认为 是 平方 序列 a? 的 一 个 带 非 齐 次 新 息 的 ARMA(2,1) BUB. AR 多 
项 式 可 以 因 式 分 解 为 (1 — 0.945B)(1 —0.820B), 这 表明 它 具 有 两 个 小 于 1 的 实 特 征 
TR. 因此 , ri 的 无 条 件 方差 有 限 , 且 等 于 0.546/(1 — 1.765 + 0.775) = 49.64. 

现在 来 考虑 马尔 可 夫 转 换 模型 . 我 们 利用 下 面 的 先 验 分 布 : 


Bi~N(0.3,0.09), 2 ~ N(1.3,0.09), £; ~ Beta(5, 95). 


初始 参数 值 为 (a) e; = 0.1; (b) si 是 一 个 具有 等 概率 的 伯 努 利 实验 , s, 是 用 初始 转 
移 概 率 产 生 的 序列 ; (c) œ = (1.0,0.6, 0.2)! , œz = (2,0.7,0.1) .asi 是 用 具有 400 个 
格 点 的 格子 Gibbs 抽取 的 , 格子 点 在 下 面 范围 是 等 间隔 的 : 


aio € [0, 6.0], ain € [0,1， aie € [0,0.5]. 


男 外 , 对 于 i = 1,2, 我 们 实施 限制 o; + aig < 1. Gibbs 抽样 进行 5 000 + 2 000 次 
JER, 但 是 仅 用 最 后 2 000 次 迭代 的 结果 来 进行 推断 . 


(a) 以 百分比 表示 的 月 对 数 收 益 率 


1940 1960 1980 2000 
(b) 状态 2 的 后 验 概率 
LO 
0.8 
4 U.6 
& 0.4. 
1.2 
0.0 


1940 1960 1980 2000 


图 12-14 (a) GE 股票 从 1926 年 到 1999 年 的 月 对 数 收益 率 的 时 间 图 ;(b) 处 于 状态 2 的 后 
验 概率 的 时 间 图 , 基于 共有 5 0004-2 000 次 迭代 的 Gibbs 抽样 的 后 2 000 次 迭代 
产生 的 结果 . 所 用 模型 是 两 状态 的 Markov 转换 GARCH-M 模型 
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表 12-5 给 出 了 (12-55) 式 中 马尔 可 夫 转 换 GARCH-M 模型 参数 的 后 验 均 值 
和 后 验 标准 误差 . 特别 地 , 它 也 包含 了 一 些 可 以 说 明 两 状态 之 间 差 别 的 统计 量 , 如 
0 = B-B. 风险 溢价 之 差 在 5 名 的 水 平 下 是 统计 显著 的 . 两 个 状态 的 波动 率 参数 的 
后 验 均 值 之 差 看 上 去 并 不 显著 , 而 波动 率 参数 的 后 验 分 布 显 示 了 一 些 不 同 的 特征 . 
图 12-15 和 图 12-16 给 出 了 马尔 可 夫 转 换 GARCH-M 模型 中 所 有 参数 的 直方 图 . 它 
们 展示 了 两 状态 之 间 的 某 种 差别 , 图 12-17 显示 了 两 状态 的 持续 参数 ou + asia 的 
时 间 图 . 它 说 明了 状态 1 的 持续 参数 频繁 地 到 达 边 界 1. 0, 但 状态 2 却 不 如 此 . 两 
状态 的 期 望 持续 时 间 分 别 是 11 个 月 和 9 个 月 . 12-14b 显示 了 每 个 观测 处 在 状 
A 2 的 后 验 概率 ， 


表 12-5 给 GE 股票 从 1926 年 1 月 到 1999 年 12 月 的 月 对 数 收益 率 拟 合 的 马尔 可 夫 
转换 GARCH-M ^ 


状态 1 
参数 By el cz10 ou a2 
后 验 均值 0.111 0.089 2.070 0.844 0.033 
后 验 标准 误差 0.043 0.012 1.001 0.038 0.033 
状态 2 
BR Ba e2 20 (21 a22 
后 验 均 值 0.247 0.112 2.740 0.869 0.068 
后 验 标准 误差 0.050 0.014 1.073 0.031 0.024 
参数 B3 — B e2 一 el ac20 — 010 021 — G11 022 — Q12 
后 验 均值 0.135 0.023 0.670 0.026 一 0.064 
后 验 标准 误差 0.063 0.019 1.608 0.050 0.043 


a 所 示 数 字 是 基于 5 0004-2 000 WEH Gibbs 抽样 的 参数 的 后 验 均 值 和 后 验 标 准 误差 . 前 5 000 
次 的 结果 舍 去 . 先 验 分 布 和 先 验 参 数 估计 值 在 文中 给 出 ， 
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m 
300 a : 
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图 1215 “对 于 GE 股票 从 1926 年 到 1999 年 的 月 对 数 收益 率 , 拟 合 两 状态 马尔 可 夫 转 换 
GARCH-M 模型 的 转移 概率 和 风险 溢价 的 直方 图 . 结果 基于 共有 5 000-+2 000 次 
迭代 的 Gibbs 抽样 的 后 2 000 次 迭代 
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12-16 ”对 于 GE 股票 从 1926 年 到 1999 年 的 月 对 数 收益 率 , 拟 合 两 状态 马尔 可 去 转换 
GARCH-M 模型 的 波动 率 参数 估计 的 直方 图 . 结果 基于 共有 5 000+2 000 次 迭代 
的 Gibbs 抽样 的 后 2 000 次 迭代 
a) 状态 1 


1.00 


去 0.95 
38 0.90 


W 0.85 
0.80 


0 500 1000 1500 2000 


1.00 
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0.80 


u 500 1000 1500 2000 
和 迭代 
图 12-17 对 于 GE 股票 从 1926 年 到 1999 年 的 月 对 数 收益 率 , 拟 合 两 状态 马尔 可 夫 转 换 
GARCH-M 模型 的 持续 参数 ou 十 oo 的 时 间 图 . 结果 基于 共有 5 000+2 000 次 
XB Gibbs 抽样 的 后 2000 次 和 迭代 


最 后 , 我 们 比较 分 别 由 简单 GARCH-M 模型 (12.57) 和 马尔 可 夫 转 换 GARCH- 


M 模型 (12.55) 所 拟 合 的 波动 率 序列 . 两 个 拟 合 波动 率 序列 (图 12-18) 呈现 了 相似 
的 模式 , 且 与 平方 对 数 收益 率 的 行为 一 致 . 简单 GARCH-M 模型 产生 了 具有 较 低 波 
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动 率 估计 的 更 光滑 的 波动 率 序列 
2000 (a) 对 数 收益 率 的 平方 


T 1500 
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(b) GAROFH-M 模 型 
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(c) 马尔 可 夫 转 换 GARCH-M 模 型 
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图 12-18 对 于 GE 股票 从 1926 年 到 1999 年 的 月 对 数 收 益 率 , 所 拟 合 的 波动 率 序列 的 时 间 
图 : (a) 对 数 收益 率 的 平方 ; (b) GARCH-M 模型 (12.57); (c) 两 状态 马尔 可 大 转换 
GARCH-M 模型 (12.55) 


12.10 预 测 


MCMC 框架 下 的 预测 很 容易 进行 . 这 个 方法 就 是 在 每 个 Gibbs 迭代 中 利用 拟 
合 的 模型 产生 预测 期 的 样本 . 从 某 种 意义 上 , 这 里 的 预测 是 利用 拟 合 的 模型 来 模拟 
预测 期 的 实现 . 我 们 利用 一 元 随机 波动 率 模型 来 说 明 该 方法 , 其 他 模型 的 预测 可 以 
利用 同样 的 方法 得 到 . 

考虑 随机 波动 率 模型 (12.20) 和 (12.21). 假定 可 以 得 到 n 个 收益 率 , 且 我 们 对 
预测 收益 率 rayi 和 波动 率 hapi 感 兴趣 (i = 1,4 £> 0). 假定 (12.20) 式 中 的 
解释 变量 ri* 在 预测 期 或 者 可 以 得 到 或 者 可 以 按 顺 序 预测 .在 MCMC 框架 下 , 模 
型 的 估计 是 通过 Gibbs 抽样 进行 的 , 从 它们 的 条 件 后 验 分 布 中 迭代 地 抽取 参数 值 . 
将 第 j 次 Gibbs 友人 代 中 的 参数 表示 为 Bj = (Bojs Bo Qj = (09,,0,) 和 
c2 ,. 换言之 , 在 第 j 次 Gibbs 迭代 中 , 模型 为 


T = oj + By jt +++ + Bp,j pe + at, (12.58) 


Inhy = Q9,j + 0,j Inh, 4c w,  Var(v) = Pegs (12.59) 
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我 们 可 以 利用 这 个 模型 来 产生 rapi 和 太一 1 … 1) 的 一 个 实现 并 将 模拟 的 实 
现 分 别 表示 为 rn4i,; 和 hnrij 这 些 实现 通过 如 下 步骤 产生 : 

e 从 N(0,a2 ;) 中 抽取 一 个 随机 样本 , 利用 (12.59) 式 计 算 hii: 

e KA N(0,1) 中 抽取 一 个 随机 样本 enpi, 得 到 oj = Yanpi jens, 并 利用 

(12.58) 式 计 算 raj. 

e XI nid, 4i—2,-..E£ 按 顺 序 重复 前 面 的 两 个 步 又 . 
如 果 在 模型 估计 中 运行 M + N 个 迭代 的 Gibbs 抽样 , 则 我 们 仅仅 需要 计算 最 后 
N 个 迭代 的 预测 . 这 样 就 得 到 了 ris 和 hnr 的 一 个 随机 样本 . 更 具体 来 讲 , 我 们 
得 到 

fr 
可 以 利用 这 两 个 随机 样本 进行 推断 ， 例 如 , 收益 率 rapi 和 波动 率 hi 的 点 预测 
就 是 这 两 个 随机 样本 的 样本 均值 . 类 似 地 , 可 以 利用 样本 标准 误差 作为 预测 误差 的 
方差 为 了 提高 波动 率 预 测 中 计算 的 有 效 性 , 可 以 利用 重点 抽样 ， 参见 Gelman, 
Carlin, Stern and Rubin (2003). 
12.7 (Pi 12.3 的 续 ) 作为 说 明 , 我 们 考虑 S&P500 指数 从 1962 年 至 1999 年 的 
月 对 数 收益 率 序列 . 表 12-6 给 出 了 收益 率 及 其 波动 率 的 以 1999 年 12 月 为 预测 原 
点 的 向 前 5 步 点 预测 GARCH 模型 (12.26) 与 随机 波动 率 模型 (12.27) 都 用 来 预 
ill. GARCH(1,1) 模型 的 波动 率 预 测 随 着 预测 时 间 区 间 的 加 大 而 渐 近 地 增加 至 无 条 
件 方差 3.349/(1 一 0.086 — 0.735) = 18.78. 用 随机 波动 率 模 型 得 到 的 波动 率 预测 值 
比 用 GARCH 模型 得 到 的 预测 值 高 . 这 是 可 以 理解 的 , 因为 随机 波动 率 模型 产生 预 
测 时 考虑 了 参数 的 不 确定 性 . 相 比 而 言 , GARCH 模型 假定 参数 固定 , HE (12. 26) 
式 中 给 出 . 这 是 一 个 重要 的 差别 , 也 是 GARCH 模型 与 衍生 产品 定价 得 到 的 隐 含 波 
动 率 相 比 可 能 低估 波动 率 的 一 个 原因 . 
表 12-6 S&P500 指 数 从 1962 年 1 月 至 1999 年 12 月 的 月 对 数 收益 率 的 波动 率 预测 ， 
预测 原点 是 1999 年 12 H^ 


预测 步 长 1 2 3 4 5 
对 数 收益 率 
GARCH 0.66 0.66 0.66 0.66 0.669 
SVM 0.53 0.78 0.92 0.88 0.84 
波动 率 
GARCH 17.95 18.12 18.24 18.34 18.42 
SVM 19.31 19.36 19.35 19.65 20.13 


a 随机 波动 率 模型 的 预测 是 由 2 000--2 000 YER Gibbs 抽样 得 到 的 . 


注释 : ”除了 在 预测 中 考虑 了 参数 不 确定 性 这 一 优势 外 , MCMC 方法 还 有 效 
地 产生 了 所 研究 波动 率 的 一 个 可 预测 分 布 . 预测 分 布 比 简单 的 点 预测 包含 了 更 多 信 
息 . 例如 , 它 可 以 用 来 得 到 VaR 计算 中 所 需要 的 分 位 数 . 口 
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12.11 其 他 应 用 


MCMC 方法 对 许多 其 他 的 金融 问题 也 是 适用 的 .例如 ,Zhang , Russell and 
Tsay (2000) 用 它 来 分 析 买 卖 报价 中 的 信息 决定 性 , Mcmulloch and Tsay (2001) 用 
此 方法 来 对 IBM 交易 数据 估计 了 一 个 等 级 模型 . Eraker (2001), Elerian,Chib and 
Shephard (2001) 用 它 来 估计 扩散 方程 这 个 方程 在 VaR 计算 中 也 是 有 用 的 , 因为 
它 提供 了 估计 预测 分 布 的 一 个 自然 方法 . 主要 的 问题 不 是 这 个 方法 是 否 在 大 多 数 
金融 应 用 中 都 可 以 利用 , 而 是 方法 可 以 变 得 多 么 有 效 . 只 有 时 间 和 经 验 可 以 提供 该 
问题 一 个 充分 答案 . 


练 习 题 


12.1 假设 x 服从 均值 为 从 ,方差 为 4 的 正 态 分 布 . 同时 假定 p 的 先 验 分 布 也 是 正 态 分 布 , 且 均 
值 为 0. 方差 为 25. 给 定数 据点 x, u 的 后 验 分 布 是 什么 ? 

12.2 考虑 12.5 节 中 带 时 间 序 列 误差 的 线性 回归 模型 , 假定 zi 是 一 个 AR(p) WH (BI z = 
Óizici t ópzi pd- ai). A o= (办 bp)’ 表示 AR 参数 向 量 . 假设 共 轿 先 验 分 布 
H B ~ N(Bs, o), 6 ~ N(bo, Ao), (v4)/o? ~ Xi, 导出 条 件 后 验 分 布 F(8IY ,.X b,a”), 
FY. X, B,o7) 和 flo|Y, X,B,9): 

12.3 考虑 12.6.1 节 中 的 线性 AR(p) 模型 . 假定 zk 和 zh+i 是 两 个 缺失 值 , 它们 的 联合 先 验 
分 布 是 均值 为 us. PTT EAE Eo 的 止 态 分 布 . 其 他 的 先 验 分 布 如 本 章 中 所 述 . 两 个 缺 
失 值 的 条 件 后 验 分 布 是 什么 ? 

12.4 考虑 General Motors 股票 从 1950 年 到 1999 年 的 月 对 数 收 益 率 的 600 个 观测 值 . 
(a) 对 此 序列 建立 一 个 GARCH 模型 ; 
(b) 对 此 序列 建立 一 个 随机 波动 率 模型 ; 
(c) 比较 并 讨论 两 个 波动 率 模型 . 

12.5 对 Cisco Systems 股票 从 1991 年 1 月 到 1999 年 12 月 的 月 对 数 收益 率 值 建立 一 个 随机 
波动 率 模型 . 你 可 以 从 CRSP 数据 库 或 文件 “d-csco9199.txt” 中 下 载 数据 . 利用 所 建 
的 模型 得 到 以 1999 年 12 月 为 预测 原点 的 向 前 1 步 的 波动 率 预 测 分 布 . 最 后 , 用 所 得 到 
的 预测 分 布 计算 下 一 交易 日 的 100 万 美元 多 头头 寸 的 概率 为 0. 01 的 VaR 值 . 

12.6 对 General Motors 股票 和 S&P500 指数 的 月 对 数 收益 率 建立 一 个 二 元 波动 率 模型 . 样本 
区 间 从 1950 年 1 月 到 1999 年 12 A. 讨论 两 个 波动 率 过 程 的 关系 , 并 计算 GM 股票 的 
时 变 beta. 
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